Trao đổi với tôi

www.hdphim.info

10/22/13

[Video] Analog và Digital

Kỹ thuật tương tự (analog techique)
Âm thanh là gì ? Khi ta rung nhanh 1 mảnh thép thì nghe có tiếng vù vù. Đó là vì : khi ta rung mảnh thép là ta đã làm cho không khí xung quanh miếng thép co dãn. Sự co dãn này truyền đến vùng không khí lân cận rồi truyền đến tai ta. Ở đây, sự co dãn không khí sẽ làm cho màng nhỉ rung động. Tiếp tục, sự rung động này làm phát sinh tín hiệu thần kinh truyền lên não. Lại tiếp tục, chính những tín hiệu thần kinh cho ta cảm giác âm thanh.
Nói chung, cái này ai học vật lý 12 thì biết rồi !
Khi ta nói trước micro thì lực của không khí tác động vào micro cũng thay đổi. Ở đây, micro đóng vai trò như màng nhỉ. Khi đó điện áp ở 2 đầu micro sẽ thay đổi theo lực của không khí. Rõ ràng,
Sự thay đổi của điện áp này sẽ tương tự với sự rung động của màng nhỉ. Bởi vậy, người ta gọi đây là kỹ thuật tương tự( Analog). Rõ ràng, bất kỳ sự thay đổi nào của điện áp này điều có ý nghĩa. Nhiễu sẽ làm cho biên độ tín hiệu thay đổi. Đây chính là nguồn gốc nhược điểm của kỹ thuật tương tự. Nó rất dễ bị nhiễu xâm nhập.
Photo Sharing and Video Hosting at Photobucket

Các bạn thấy nó y như phép tính cộng vậy á ! Giả sử tín hiệu không nhiễu cho ta cảm giác tiếng nói còn nhiễu cho cảm giác xì xì, vậy tín hiệu bị nhiễu cho ta cảm giác gì ? Ta sẽ có cảm giác tiếng người và tiếng xì . Đơn giản đúng hôn ? Khi kết hợp 2 tín hiệu lại thì ta chỉ có 1 tín hiệu. Ở 1 thời điểm, vị trí của màng nhỉ là cố định. Không thể nào, màng nhỉ nhô ra ngoài vì có sự tác động của tiếng nói, mà cũng lúc đó, màng nhỉ lại lõm vào trong(não) vì sự tác động của tiếng xì. Chỗ này có thể hơi khó hiểu. Vì đâu đó ta có thể nói "vừa có tiếng nhạc vừa có tiếng xe chạy ở ngoài đó...". Sở dĩ, có như vậy là do não ta có khả năng phân tích âm thanh. Do đó, đủ thứ trộn lộn lại nhưng ta vẫn phân biệt được. Cái này cũng tùy. Ví dụ, mình có thể phân biệt được giọng nói của 2 người nào đó nhưng nếu họ cùng hòa ca thì có thể mình chẳng phân biệt được tiếng ai. Nếu thay vì 2 mà 20 thì chắc cú là hết biết
Ở 1 thời điểm, vị trí màng nhỉ là xác định, phụ thuộc vào tổng sự tác động của tiếng nói và tiếng xì. Tín hiệu điện cũng vậy! Ví dụ này dễ hiểu hơn. Giả sử, có 2 người ở 2 phía đang kéo tay bạn. Rõ ràng, ở 1 thời điểm, vị trí của bạn là xác định và chỉ có 1 vị trí mà thôi! Vị trí của bạn sẽ phụ thuộc vào lực của A và B tác động vào bạn. Khi nào, bạn vừa ở A mà lại ở B thì chắc cú bạn đã bị phanh thây rồi Và cái màng nhỉ của bạn chắc là rách làm 2 miếng rồi! Một miếng lồi ra, 1 miếng lõm vô
Cái này bên Điện Tử kêu là "nguyên lý chồng chập", có nhiều thì cứ chồng lên, chập lại

Nhiễu là gì ? Nhiễu thường là các tín hiệu ngẫu nhiên như sự chuyển động nhiệt của các electron,...
Khi nghe radio thì ta có thể nghe tiếng gió, tiếng hú, .. hoặc khi nghe băng cát-xét thì có tiếng xì xì thì đó chính là nhiễu. Khi ta nghe radio đài A nhưng có khi có cả tiếng đài B. Mặc dù rất nhỏ nhưng tiếng đài B có thể gây khó chịu cho ta. Vậy nhiễu là tín hiệu mà ta 0 mong muốn. Nguồn gốc của nhiễu có thể là sét, động cơ chổi quét, xung điện.... và đặc biệt là nhiệt độ, điện trở.. Điều này cho thấy, bất kỳ thiết bị analog nào cũng có nhiễu. Chuyện này cũng dễ hiểu. Vì bất kỳ sợi dây điện nào cũng có điện trở và vì nhiệt độ của máy cát-xét thì dĩ nhiên cũng phải 20-30 độ C. (nếu ở 0 độ K hay -273 độ C thì 0 có nhiễu nhưng ....)


Nếu ta có 1 băng cát-xét gốc là A, rồi đem sang(chép) qua băng B ---> nhiễu của băng B sẽ nhiều hơn băng A. . Khi nghe nhạc từ máy A thì ta nghe nhạc của băng A mà cũng nghe luôn nhiễu của máy cat-xét vì bản thân nội tại máy cát-xét luôn có tạp âm
Nếu ta sang(chép) qua băng C thì nhiễu của băng C lại càng nhiều hơn băng A. Bởi vậy, nói sao ai cũng mê đồ gốc, đồ zin là vậy ! ( theo hankuk biết thì "đồ zin" là gốc tiếng Anh , chữ orginal, do việt nam mình thích đơn giản nên lấy chữ "zin", còn "đồ lô" là từ chữ local ) Máy cát-xét bao gồm 1 đầu từ và mạch khuếch đại. Chính mạch khuếch đại này đã thêm nhiễu vào tín hiệu. Khi đó, nếu ta ghi xuống băng B thì rõ ràng tín hiệu trên băng B cũng bao gồm nhiễu của máy cát-xét
Vậy còn đĩa CD thì sao ?

Kỹ thuật số (Digital techique)
Hệ số:

Hệ số nôm na là tập hợp những chữ số mà ta dùng để đếm. Con người sử dụng hệ 10 để đếm. Người ta cho rằng sở dĩ vì vậy có lẽ do con người có 10 ngón tay.

Hệ 10 : 0 1 2 4 5 6 7 8 9 .
ví dụ 1 : 124
ví dụ 2 : 2006
Nhận xét: các con số(number) trên chỉ bao gồm các chữ số(digit) trong hệ 10.

Quá trình đếm của hệ 10:
1-->2...... ->10>11....-->19-->20......
Ta thấy cứ đếm 10 lần thì được 1 chục. 19 =1 chục + 9 đơn vị. Thêm 1 đơn vị vô 19 --> 1 chục + 9 đơn vị + 1 đơn vị =1 chục + 1 chục = 2 chục = 20
19 +1= 10+9 +1= 10+ 9+1= 10+10 =20
Vd : 90 + 10 = 9 chục + 1 chục = 10 chục ? Không ! 90 + 10 =100 . Vậy 10 chục thì được 1 trăm
Một chục trong hệ thập phân chỉ có 10 đơn vị. Nhiều khi đi chợ mua 1 chục cam nhưng người ta bán cho tới 13-14 trái lận đó! Bởi vậy 1 chục chưa chắc là 10 đâu !

Hệ nhị phân: chỉ gồm 2 chữ số: 0 1
vd1: 0
vd2: 1001 ( đọc là 1 ngàn lẻ một nhưng thường đọc là "một không không một")
vd3: 10 ( đọc là mười hoặc một không)

Chữ số của hệ nhị phân được người ta gọi là bit (binary digit). Từ đây, ta 0 cần phải nói là "con số này có 2 chữ số nhị phân" mà chỉ cần nói là "con số này có 2 bit"

Quá trình đếm của hệ nhị phân:
0-->1-->10-->11....
Ta thấy 2 đơn vị thì được 1 chục. Ví dụ : bạn có số : 1001 = 1000 + 1. Do vậy 1001+1 = 1000+1 +1=1000+10=1010
Cứ 2 đơn vị thì được 10. 2 cái 10 thì được 100....
111 + 1= 100+10+1 +1
= 100+10 +1+1
= 100+10 +10= 100+100= 1000
Đi mua cam, quít ở chợ mà tính theo hệ nhị phân thì chắc chết !

Chuyển đổi hệ 10 sang hệ 2
vd : 15 hệ 10 ->>> hệ 2
14 chia 2 = 7 dư 0
7 chia 2 = 3 dư 1
3 chia 2 = 1 dư 1
1 chia 2 = 0 dư 1
Ta chia cho 2, lấy thương chia tiếp cho 2, khi nào số dư = 0 thì dừng
Kết quả là số dư . Hơi bất ngờ! Lấy số dư ngược từ dưới lên!
15 -> 1110

Chuyển đổi hệ 2 sang hệ 10
vd : 1110
1 1 1 0
3 2 1 0
1 x23 + 1x 22 + 1x21 + 0x20
=8 + 4 + 2 + 0
=14
vậy 1110 ---> 14



Tóm lại:
-- có thể đếm bằng nhiều hệ số. Không nhất thiết phải là hệ 10.
-- có thể chuyển đổi qua lại giữa các hệ số

Tín hiệu tương tự và tín hiệu số:
"hinhtinhieu" Photo Sharing and Video Hosting at Photobucket
Ta thấy tín hiệu tương tự là:
- 1 miền liên tục,
- chỗ nào cũng mang ý nghĩa và có rất nhiều giá trị
Còn tín hiệu số thì :
- chỉ có 2 giá trị : 0 và 1
-
Mức 1 không nhất thiết phải điện áp dương hoặc lớn hơn mức 0 . Điện sao cũng được, miễn là có 2 mức khác nhau. Ví dụ: 15V là mức 0 còn -5 là mức 1, tùy thuộc vào hệ thống. Trên hình, có chỗ điện áp là 4V nhưng vẫn là mức 1. Nhiễu chỉ có thể tăng/giảm biên độ tín hiệu nhưng trong hệ thống số, tín hiệu chỉ có 2 mức nên 4V vẫn là mức 1. Rõ ràng, tín hiệu số có khả năng hạn chế nhiễu. Nếu tín hiệu là 3V thì sao ? Lúc đó, nó không xử lý chứ sao Lúc đó, hệ thống không thể xử lý được nữa, tức là bị treo máy. Nói chung, người ta luôn chọn khoảng cách giữa mức 1 và mức 0 sao cho hệ thống vẫn hoạt động tốt với mức ảnh hưởng lớn nhất của nhiễu. Nhiễu thường bé lắm ! Cỡ mili vôn thôi ! Chừng nào nhà bạn xài điện 1KV chẳng hạn , khi đó mỗi lần tắt mở đèn thì có thể có 1 V nhiễu ảnh hưởng tới các thiết bị điện.
Nhiễu nhỏ như vậy, cỡ mili vôn hoặc micrô vôn mà nghe cát-xét thì vẫn nghe tiếng xì ? Bởi vì tín hiệu đọc được bởi đầu từ thì cỡ vài mili vôn thôi! Mà nhiễu thì chỗ nào cũng ảnh hưởng, cũng xâm nhập được, tức là đầu từ cũng bị nhiễu. Do vậy, ở lúc đó, chỉ vài mili vôn nhưng ảnh hưởng rất ghê! Mới đọc từ băng lên chỉ có 10mV mà nhiễu tới 3mV rồi! Suy nghĩ 1 chút, ta thấy để đánh giá mức ảnh hưởng của nhiễu thì 0 thể dựa vào điện áp nhiễu. Tín hiệu 5V còn nhiễu vài 5mV thì 0 sao nhưng tín hiệu 200mV mà nhiễu cỡ vài mV là ghê ! Để đánh giá điều này, người ta sử dụng thông số S/N ( signal/noise ) , tức là tỷ số tín hiệu/nhiễu
th1 : S/N = 5V / 5mV = 1000
th2: S/N= 200mV/ 5mV = 40

Ngoài ra còn có đại lượng PSNR , PSNR = 20lg S/N (peak signal to noise ratio )
th1 : PSNR = 20log 1000 = 20x3 = 60dB
Tại sao phải lấy log ? Vì tai người, mắt người thường 0 tuyến tính, tức 0 tăng theo hàm bậc nhất . Ví dụ, bạn nghe 1 âm thanh 2W và 8W thì chưa chắc gì có cảm giác lớn gấp 4 lần . . Chú ý dB có thể âm , vd lg (0/1000) = -2 . Khi đó thì nghe nhỏ hơn
Hàm lg là phép toán ngược với phép lũy thừa
102 = 100 =>lg 100= 2

Hankuk có cảm giác diễn đàn có nhiều bạn chưa học hết lớp 12 nên hankuk viết vậy ! Có gì thì thông cảm nhe !

Trong quá trình ghi đĩa CD, gặp bít 0 thì tia la-de bắn 1 lỗ còn bít 1 thì không bắn.
Khi đọc đĩa CD, con mắt sẽ phát ra tia la-de. Khi gặp lỗ, tia la-de không dội lại, ta đọc được bít 0. Chỗ nào còn nguyên nên tia la-de sẽ dội lại thì ta đọc được bít 1.
Rõ ràng, với hệ thống tương tự, các máy móc phải được thiết kế để phân biệt rất nhiều mức tín hiệu. Trong khi đó, với hệ thống số, máy móc chỉ cần phân biệt 2 mức. Với 2 mức là rất dễ chế tạo. Ví dụ như, công tắc=đóng hoặc mở, đèn=sáng hoặc tắt, dây điện=dẫn hoặc ngưng, tụ điện= phóng điện hoặc nạp điện, con người=yêu hoặc ghét
Tóm lại, với đĩa CD thì cứ vô tư sao chép, miễn đĩa tốt thì 0 bao giờ xì-xẹt do sao chép nhiều.
Không bao giờ có chuyện :
- chép 1 file A từ đĩa C rồi sang đĩa D thì nghe dở hơn.
- từ đĩa C máy bạn -->USB--> máy mình thì lại dở hơn.
Không Bao Giờ ! Không Bao Giờ
Kỹ thuật số hay ở chỗ đó !

Lấy mẫu: (SAMPLING)
"Lấy mẫu" ? Giả sử có 1 đống cam, ta lấy ra 1 trái, ăn thử rồi kết luận chất lượng nguyên đống cam. Cái đó là gọi là lấy mẫu. Hoặc có 1 bao gạo, chả lẽ đổ nguyên bao ra rồi kiểm tra ? người ta chỉ lấy 1 miếng gạo trong bao coi thử thôi ! và coi chất lượng nhúm gạo đó là chất lượng cả bao.
"hình lấy mẫu" Photo Sharing and Video Hosting at Photobucket
T1, T2... là các lần lấy mẫu.
t1, t2... là thời gian . chú ý chữ in hoa và chữ thường

Lấy mẫu là giai đoạn đầu của quá trình chuyển tín hiệu tương tự thành tín hiệu số( tức điện áp ở micro thành điện áp số để lưu vô đĩa CD). Cứ sau 1 khoảng thời gian cố định, người ta đo đạc tín hiệu tương tự . Từ t1 đến t2, có vô số giá trị nhưng ta chỉ lấy 9 làm giá trị đại diện. Tương tự cho các thời điểm khác. Vì sao 0 lấy hết các giá trị mà chỉ lấy ở thời điểm T1 ? Dễ hiểu thôi ! Vì sao 0 kiểm tra nguyên bao gạo mà chỉ lấy 1 nhúm ra coi rồi kết luận ? Vì nhiều quá ! Người ta mua bán cả tấn chứ có mua bán 1-2kg đâu ! Nếu làm vậy thì quá mất thời gian. Nếu ta lấy mẫu hết thì rõ ràng ta cần nhiều đĩa để lưu trữ. Bởi vậy mà từ t1->t2, ta lấy 1 giá trị thôi !
Số lần lấy mẫu trong 1 giây gọi là tần số lấy mẫu Sampling rate

Quantize: lượng tử hóa
Người ta chia điện áp đo được thành các mức Một mức đại diện cho 1 khoảng giá trị.
Ví dụ 16 mức
0 - 1V : mức 0
1V - 2V: mức 1
........
15V - 16V : mức 15
giả sử điện áp đo được là :
0.5V ---> mức 0 ,
1V ---> mức 1 ,
1.2V ---> mức 1 ,
3V ---> mức 3 ,
5.4V ---> mức 5 ,

Sau bước lượng tử hóa, miền giá trị của các điện áp đọc được là rất rộng sẽ trở thành 1 số giá-trị nhất định. Như ta thấy, 1V và 1.2V đều là mức 1 . Vậy ở bước này, 1 lần nữa ta lại "làm giảm".
-----Số lần lấy mẫu là vô hạn --> trong 1 khoảng thời gian thì chỉ lấy 1 số mẫu nhất định
----- giá trị của các mẫu lấy được là vô hạn ----> chia thành các mức và 1 khoảng giá trị sẽ được đại diện bởi 1 mức
Bước này, nói cho toán học 1 chút là " Ta rời rạc hóa tín hiệu". Đúng hôn? Đang 1 đường liền lạc thì biến thành 101010
Bước cuối:
Bước này đơn giản là ta đổi hệ 10 thành nhị phân. Sau đó, dĩ nhiên là truyền đi hoặc là lưu vô đĩa CD, đĩa cứng (nếu đang thu âm... )
Vd: lấy ví dụ trên
0000 , 0001 , 0001 , 0011 , 0101

Số các mức gọi là độ rộng của mẫu (Resolution, ), ví dụ trên độ rộng là 16 mức => dùng 4 bit nhị phân để lưu trữ.
4 bit nhị phân ? Bây giờ, quay về với hệ 10. Ta muốn đánh số 25 trái cam thì ta dùng bao nhiêu số, bao nhiêu chữ số cho 1 số ?
Dĩ nhiên là 25 số : 1, 2, 3, 4,.... 10, 11, ...25 . và tối đa là 2 chữ số ( 25 có hai chữ số chứ gì nữa ! ) . Một con số có 2 chữ số thì có tất cả bao nhiêu số ? có 100 số : 00 , 01, 02, ...... 99 . Tương tự, dùng 1 số nhị phân có 4 bit thì có tất cả 16 số nhị phân : 0001, 0010,....... 1111 . Mẹo : 24 =16 . Muốn lưu trữ 256 số thì số bit cho 1 số là 8 (vì 28 = 256 )

Tốc độ lấy mẫu = tần-số-lấy-mẫu x độ-rộng-mẫu . Tiếng Anh gọi là sampling rate
vd: 22khz x 8 bit = 176kb/s

Trên là quá trình tạo tín hiệu PCM. Khi bạn thu âm bằng micro thì thực sự ta đang thực hiện quá trình trên. Bây giờ dòm "PCM 44khz 16bits " thì chắc là bạn đã hiểu được ý nghĩa của chúng

Giải mã :
hinhgiaima Photo Sharing and Video Hosting at Photobucket

Các bạn thấy sau khi giải mã thì ta thu được 1 đường gấp khúc trong khi đường gốc là 1 đường cong. Chuyện này dễ hiểu đúng 0 ? Cũng dễ thấy, nếu ta càng tăng tần số lấy mẫu, tăng độ rộng mẫu thì đường giải mã sẽ càng mịn và càng giống đường gốc. Điều này giải thích tại sao bitrate càng cao thì nghe càng hay, càng giống thực. Ông Nyquyst đã nghiên cứu và nói là tần số lấy mẫu lớn hơn 2 lần băng thông thì kết quả thu được là gần trung thực . Ví dụ: tai người nghe 0-20Khz, băng thông = 20khz-0hz = 20khz, vậy thì tần số lấy mẫu ít nhất phải là 2x 20khz =40khz. Cái này đúng hơn là "có thể chấp nhận được" ! Thời nay, với đĩa DVD, người ta đã xài tới 96kHz
Dù tần số lấy mẫu có tăng lên thì rõ ràng ta cũng mất thông tin. Ta đã 0 lưu trữ tất cả. Cái gì mà chuyển sang Digital thì đã cắt thành từng khúc hết rồi ! Khi đó chỉ có mất đi chứ 0 thể thêm ra. Bởi vậy đừng dùng phần mềm convert để tăng bitrate hay tần số lấy mẫu. Ảnh số cũng tương tự. Khi phóng to ảnh trên máy vi tính thì quá ghê ! Càng phóng càng ghê ! Quá trình scan hình cũng như trên đó! Người ta chia tấm hình thành những ô nhỏ, gọi là pixel. Trong 1 ô như vậy chắc cú là có nhiều điểm với màu khác nhau nhưng người ta chỉ lấy 1 màu làm đại diện. Dễ thấy, nếu số pixel cao và độ sâu màu cao thì ảnh sẽ đẹp và sắc nét. Với máy ảnh số thì màn hình bao gồm những cảm biến. Mỗi cảm biến là 1 pixel, màu của 1 cảm biến là màu của 1 điểm ảnh. "Cảm biến" ? cảm biến là từ chỉ thiết bị cảm nhận được sự biến đổi? Nói chung, cái nào mà biến ánh sáng, nhiệt độ,.. thành điện thì là cảm biến(sensor). Ánh sáng, nhiệt độ,.. thay đổi thì điện cũng thay đổi theo là được. Và đều được gọi là thiết bị mặc dù nó nhỏ xíu
Tới đây, có thể bạn nói là " Sao mất đi mà tui có thấy gì đâu ?" . Nhanh quá nên mình khó nhận ra bạn ạ!

Kết luận:

- Bitrate , tần số lấy mẫu càng cao thì nghe càng hay
- Convert lại để tăng bit rate/tần số trên máy vi tính 0 làm chất lượng tăng lên. Cụ thể hơn:
---nếu có 1 file mp3 64kbs thì chuyển sang mp3 128kbs thì hoàn toàn 0 hay thêm.
---hoặc là WMA 64kbs rồi dùng phần mềm convert sang WMA 256kbs thì cũng 0 hay thêm
---có 1 file mp3 64kbs 32kHz , rồi chuyển sang mp3 128kbs 44kHz thì hoàn toàn 0 hay thêm
- Hạn chế sự có mặt của thiết bị Analog trong quá trình xử lý/biên tập âm thanh/hình ảnh.
----Có 1 số bạn làm file WAV như vầy : hát file rồi dùng Reocoder thu lại thành WAV. Khi hát file thì file đó được chuyển thành PCM --> soundcard chuyển thành analog, chỗ này đã có nhiễu ---> chuyển thành digital, lại nhiễu, méo 1 lần nữa

Trên chỉ là tín hiệu PCM. Các file WMA, MP3 , AAC, đều là dạng lossy(mất thông tin). Các encoder Mp3,... sẽ cắt bớt những phần mà tai người rất ít nhận ra, vd: khoảng tần số cao 16khz-20khz, hoặc là trong lúc có rất nhiều âm to, nhỏ thì những âm nhỏ sẽ được bỏ đi .

Nhiều khi mua đĩa ở tiệm nhỏ, bán ở lề đường giá khoảng 4000-6000 đĩa thì nghe dở hơn đĩa gốc 30-50 ngàn ? Các bạn để ý 1 điều : đĩa mua ở chợ thường cảnh là phim. Đĩa mua ở lề đường toàn là phim trong khi đĩa gốc có cảnh đàng hoàng. Nhạc yêu đương thì quay cảnh yêu đương chứ 0 phải tiếng yêu đương mà hình đánh đá . Nguồn của mấy ông làm đĩa là trên mạng thôi ! Trên mạng thì là mp3, wma,.. đều là những dạng lossy . Sau đó, mấy ổng đó phải chuyển thành MPEG để ghi ra đĩa VCD. Mà MPEG lại là 1 dạng lossy . Hai lần lossy nên chất lượng kém là phải.
 
http://thuongshoo.blogspot.com/2007/07/bi-8-analog-v-digital.html

No comments:

Post a Comment