1. 多媒體的基本概念
1.1. 媒體及多媒體的定義:
媒體:存儲信息的實體(磁帶、磁盤、光盤等)/ 信息表示和傳播的載體(數字、文字、聲音和圖形等)
在多媒體計算機中,媒體指的是后者。
多媒體:將這些媒體信息在計算機內以數字形式來表示,并綜合起來形成一種全新的媒體概念。
1.2. 多媒體基本元素:
文本 Text:各種文字(各種字體、大小、格式及色彩)
圖形 Graph 和圖像 Image(圖形:點、線、面到三維空間的黑白或彩色的幾何圖形;圖像:由稱為像素(Pixel)的點構成的矩陣圖,也稱為位圖(Bitmap))
視頻 Video
音頻 Audio (音樂,語音等)
動畫 Animation:借助計算機生成的一系列連續運動的圖畫。
1.3. 多媒體的五種類型:
感覺媒體(直接作用于人的感官)
表示媒體(媒體的核心;語言編碼、圖像編碼、文本編碼等)
顯示媒體(感覺媒體和用于通信的電信號之間轉換的媒體;輸入/輸出;鍵盤/顯示器)
存儲媒體(光盤、硬盤、軟盤和磁帶)
傳輸媒體(通信信息傳輸載體;有線/無線;電纜,光纖/衛星,微波)
1.4. 多媒體技術及特性:
多媒體技術:利用計算機技術把多媒體信息綜合一體化,使它們建立起邏輯聯系,并能進行加工處理的技術。
特性:
多樣性(文字、圖形、圖像等等)
集成性(各種存儲信息的實體和多媒體設備的集成、承載信息的載體的集成)
交互性(人與人、人與機器、機器與機器)
數字化(各種媒體的信息都是以數字的形式進行存儲和處理)
2. 多媒體信息處理的關鍵技術
2.1. 信息壓縮技術:圖像、視頻、聲音等數據的壓縮和解壓縮(多媒體核心技術之一)
2.2. 數據存儲技術(存儲音頻、視頻、圖像等;硬盤、光盤、磁帶等)
2.3. 多媒體專用芯片技術(固定功能等芯片和可編程等數字信號處理器)
2.4. 多媒體數據庫技術(研究方向:多媒體數據模型;數據壓縮和解壓縮格式;多媒體數據管理及存取方法;用戶接口)
2.5. 多媒體網絡與通信技術(多媒體通信網技術、視頻和音頻信號的壓縮/解壓縮技術;多媒體信息的多路混合傳輸等技術)
2.6. 多媒體同步技術(同時處理文字、聲音、圖像等多媒體信息,各媒體都與時間有著或多或少的依從關系)
2.7. 超文本與超媒體技術
2.8. 虛擬現實技術(Virtual Reality,VR;利用計算機生成一種模擬環境;多感知性、臨場感、交互性、自主性)
3. 多媒體技術的應用領域
3.1. 多媒體教學(PPT、視頻)
3.2. 電子出版物(paper、essay、thesis and so on;教學類、文化類、數據庫類、娛樂類)
3.3. 信息咨詢服務(靜態、動態資訊系統)
3.4. 多媒體網絡應用(Internet、Video On Demand,VOD、遠程教育、視頻會議系統、網購)
4. 多媒體計算機系統
4.1. 多媒體計算機硬件系統:
五個層次:
多媒體應用系統運行平臺(多媒體播放系統)
多媒體編輯與創作系統(多媒體制作平臺和媒體制作工具軟件
多媒體應用程序接口(MAPI)(為上層提供軟件接口;給多媒體實現軟件調用提供條件)
操作系統、多媒體設備驅動程序(控制驅動多媒體;輸入/輸出控制接口程序(I/O接口程序)
多媒體計算機主機(Multimedia PC MPC)、外圍設備
4.2. 多媒體計算機軟件系統:
多媒體驅動軟件(設備初始化、設備打開、關閉、壓縮解壓、圖像變換等)
支持多媒體等操作系統或操作環境(Windows)
多媒體數據準備軟件(采集多媒體數據的軟件——聲音錄制與編輯、圖像掃描等)
多媒體編輯創作軟件(AuthorWare、ToolBook、Flash、Visual Basic、Visual C++等)
多媒體應用軟件(多媒體數據庫、教育軟件和娛樂軟件)
5. 多媒體音頻處理技術:
5.1. 概述:
音頻:多媒體系統中使用最多的信息,聲音攜帶信息量大,精細、準確。
5.2. 音頻信號數字化:
聲音的模擬信號——采樣——量化——編碼——聲音的數字信號
采樣和量化:通過模/數(A/D)轉換器(以固定的頻率去采樣,即每個周期測量和量化信號一次)實現。
采樣:將連續變化的模擬音頻信號轉換成計算機能處理的離散化數字信號的第一步。(每隔一定時間對模擬波形取一個幅度值,把時間上的連續信號變成時間上的離散信號。)
量化:將每個采樣點得到的幅度值以數字的方式存儲。(量化位數,即采樣精度:表示存放采樣點振幅值的二進制位數;在相同的采樣頻率下,量化位數越大,則采樣精度越高,聲音的質量也越好,信息存儲量也相對越大。)
編碼:將采樣和量化后的數字數據以一定的格式記錄下來。(常用編碼方式:脈沖編碼調制,Pulse Code Modulation,PCM;抗干擾能力強,失真小,傳輸特性穩定)
5.3. 數字音頻技術指標:
數字音頻的質量指標:采樣頻率、量化位數(采樣精度)、聲道數
聲音(波)是有方向的,可以通過反射產生特殊的效果。聲音到達左右兩耳的相對時差和不同的方向會使人感覺不同的強度,因此會產生立體聲的效果。
聲道數:聲音通道的個數。(單聲道只記錄和產生一個波形;雙聲道產生兩個波形——立體聲)
記錄每秒存儲聲音容量的公式:
存儲容量(字節數)=采樣頻率??采樣精度??聲道數?8
5.4. 數字音頻的文件格式:
WAV(.wav)文件:Microsoft公司采用的波形聲音文件存儲格式。(質量非常高,但是文件太大)
MIDI(.mid)文件:樂器數字接口,Musical Instrument Digital Interface,是數字音樂的國際標準。
MPEG-3(.mp3)文件:最流行的聲音文件格式。(壓縮率大,音質就相對差了)
RA(.ra)文件:Real Audio,網絡的靈魂,強大的壓縮比和極小的失真。(主要目標壓縮比和容錯性,其次音質)
CD(.cda)文件:記錄的是小型音樂數據流,音質純正,高保真;但是無法編輯,文件太大。
高保真程序:原聲樂器演奏、MIDI、CD唱片、聲卡上的MIDI。(MP3和RA則要看節目源采用的是MIDI、CD還是其他)
6. 多媒體圖像與視頻信息處理技術
6.1. 基本概念:
圖形(Graphics):指通過繪圖軟件繪制的由直線、圓、圓弧、任意曲線等圖元組成的畫面,以矢量圖形文件格式存儲。
圖像(Images):由掃描儀、數字照相機、攝像機等輸入設備捕捉的真實場景畫面產生的映像,數字化后以位圖形式存儲。
矢量圖形與位圖圖像可轉換,前者轉換成后者,只要在保存圖形時,將格式設置成位圖圖像的格式即可,反之要用專業軟件。
6.2. 圖像的數字化:
圖像的數字化:將一幅真實的圖像轉變成計算機能夠接受的數字形式。
圖像(模擬量)——采樣——量化——編碼——數字化圖像
6.3. 圖形、圖像文件的格式:
BMP(.bmp)文件:(Bitmap位圖)與設備無關的圖像文件格式;Windows常用;包含圖像信息豐富,幾乎不壓縮;占內存
GIF(.gif)文件:(Graphics Interchange Format,圖形交換格式)壓縮比高、磁盤空間占用少;不能存儲超過256色的圖像;Internet上大量采用的彩色動畫文件多用此格式。
JPEG(.jpg)文件:(Joint Photographic Experts Group,聯合圖像專家組)壓縮比高;存儲和顯示速度慢;Most Popular —— 能處理超過256色的圖像。
WMF(.wmf)文件:特殊的圖元文件,屬于矢量圖形;Windows的剪貼畫圖像是以這種格式存儲的。
6.4. 視頻信息:
視頻:由一系列靜態圖像按照一定的順序排列組成的,每一幅畫面稱為幀(Frame)。
分類:模擬視頻(早期的電視等視頻信號的記錄、存儲和傳輸采用模擬信號)和數字視頻(VCD、SVCD、DVD等)
模擬視頻中,兩種視頻標準:NTSC制式(30幀/秒,525行/幀);PAL制式(25幀/秒,625行/幀)— 我國使用。
6.5. 視頻信息等數字化:
過程與處理音頻相似:對單幀視頻信號采樣、量化、編碼等,然后實現模數轉換、彩色空間變換和編碼壓縮等(視頻捕捉卡和相應軟件)
數字化后,視頻信號:數據量的大小為:幀數??每幀圖像的數據量(分辨率為1280??1024像素的24位真彩色電視圖像,按照每秒30幀計算,顯示1分鐘,需要:1280(行)??1024(列)??3(B)??30(幀/秒)??60(秒)約等于6.6GB。
由此可見,數據量的降低依靠于視頻信息的壓縮、降低幀數、縮小畫面尺寸等實現。
6.6. 視頻文件:
1)影像視頻文件:
AVI(.avi)文件:(Audio-Video Interleaved,音頻-視頻交錯)低成本、低分辨率的視頻格式;數據量較大,要壓縮。
MOV(.mov)文件:Apple公司開發使用的視頻格式;可合成視頻、音頻、動畫、靜止圖像等;數據量較大,要壓縮。
MPG/MPEG(.mpg/.mpeg)文件:是按照MPEG標準壓縮的全屏視頻的標準文件。
DAT(.dat)文件:是VCD專用的格式,文件結構和MPEG文件格式基本相同。
2)流媒體文件:
RealMedia:包括RA(RealAudio)和RM(RealVideo Media)和RF(RealFlash)三種文件格式。(RealNetworks 公司)
QuickTime:QuickTime Movie的QT格式是(Apple公司)開發的一種音頻、視頻文件格式。
ASF:(Microsoft公司)的Windows Media的核心是ASF(Advanced Stream Format)。ASF是一種數據格式,音頻、視頻、圖像以及控制命令腳本等多媒體信息通過這種格式,以網絡數據包的形式傳輸,實現流式多媒體內容發布。
6.7. 數據壓縮技術:
數據壓縮:是通過編碼的技術來降低數據存儲時所需的空間,當需要使用時,再進行解壓縮。可分為有損壓縮和無損壓縮。
衡量壓縮技術的重要指標:
壓縮比:壓縮前后所需要的信息存儲之比(越大越好)
恢復效果:盡可能恢復到原始數據。
速度:壓縮、解壓縮的速度(解壓縮速度要盡可能快)
開銷:實現壓縮的軟、硬件開銷(越小越好)
無損壓縮:
利用數據統計冗余性進行壓縮且通過解壓縮完全恢復原始數據而不引起失真的一種壓縮方法。(壓縮比限制2:1到5:1)
有損壓縮:
以犧牲某些信息為代價,換取較高的壓縮比。(并不能完全恢復全部原始數據,但損失的數據不影響對原始數據的理解)
數據壓縮的國際標準:
JPEG標準:適用于色調和多級灰度的靜態圖像,一般對單色和彩色圖像壓縮比通常為10:1和15:1;常用于CD-ROM、彩色圖像傳真和圖文管理。
MPEG標準:不僅適用于運動圖像,也適用于音頻信息。(三部分:MPEG視頻、MPEG音頻、MPEG系統-視頻音頻同步)MPEG標準已指定了MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21等多種標準。? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? MPEG-1:為有限帶寬傳輸設計的,數據傳輸率為1~1.5Mb/s,平均壓縮比為50:1;常用于VCD的壓縮。? ? ? ? ? ? ? ? ? ? ? ? ? ? MPEG-2:為高帶寬傳輸設計的,數據傳輸率為4~10Mb/s,壓縮比高達200:1;可支持播放高質量的數字式電視,DVD。 MPEG-4:是“甚低速率視聽編碼”標準,數據傳輸率小于64Kb/s;多用于移動多媒體通信,因特網,實時多媒體監控等。
H.261 視頻通信編碼標準:電視電話/會議等H.261編碼標準,即P*64視頻編碼/解碼標準;是一種關于視頻和聲音以64Kb/s等整數倍作為傳輸速率的雙向傳輸標準。(H.261標準和MPEG相互不兼容,采用公共中間格式CIF和1/4CIF)
文件壓縮和解壓縮軟件:WinRAR,WinZip等。。。。。。。。。。
7. 多媒體素材的制作:
7.1. 文字的制作:
文本文字:多使用字處理軟件(寫字板、Word等)通過錄入、編輯排版后而生存。
圖形文字:多需要使用繪圖工具軟件(畫筆、Photoshop等)來生成。
7.2. 音頻數據等制作:
Windows自帶的工具——錄音機用來錄音。
Windows Media Player:收音機、視頻播放機、CD播放機和信息數據庫的集合體。
Adobe Audition:錄制、混合、編輯和控制音頻;創建音樂、錄制和混合項目、制作廣播點、整理音頻或設計聲音。
。。。。。。。。。。。(網上可以搜到很多、、、、)
7.3. 圖像數據的制作:
圖像數據的獲取方法:
使用掃描儀掃描圖像
繪圖軟件創建圖像(CorelDRAW、Photoshop - need to learn、PhotoStyler等)
商品圖像庫中獲取
使用攝像機錄制
數字照相機
7.4.動畫制作:
二維動畫制作軟件:Animator Pro、Flash等
三維動畫制作軟件:3d max等
8. 常用多媒體軟件
8.1. 抓圖軟件:
屏幕復制:(全屏復制 PrintScreen和當前窗口復制 Alt+PrintScreen ——打開畫圖程序:編輯-粘貼)。
Snaglt抓圖軟件:直接按PrintScreen,然后抓的圖直接進入SnagIt編輯區。
截圖軟件:太多了。。。。。個性化截圖
8.2. 播放軟件:
錄音機:Windows系統附件。
Windows Media Player:多媒體播放器。
RealPlayer播放器
QQ影音/暴風影音/迅雷看看/優酷/愛奇藝/PPTV/騰訊視頻等。
8.3. 電子閱讀器:
Adobe Reader:閱讀、編輯PDF文件。
iBook
簡書
8.4. Photoshop圖像處理軟件:
采用開放式結構,能夠外掛其他處理軟件和圖像輸入/輸出設備。
攝影者:處理圖像和修飾照片等功能,快速合成各種景物,創作精美圖片。
印刷業:掃描、修改圖像、設計印刷品等功能,根據不同需要印刷到產品包裝上。
廣告設計:無限的創作發展空間。