Tìm hiểu kiến thức cơ bản về âm thanh - pdf 27

Download miễn phí Tìm hiểu kiến thức cơ bản về âm thanh



Mục lục 1
Lời nói đầu 3
PHẦN I . LÝ THUYẾT 4
CHƯƠNG 1. CÁC KIẾN THỨC CƠ BẢN VỀ ÂM THANH 5
I. NHỮNG KHÁI NIỆM CƠ BẢN - SÓNG CƠ 6
1.1. Sự hình thành sóng trong môi trường đàn hồi 6
1.2. Các đặc trưng của sóng. 7
1.3. Phương trình sóng. 8
II. SÓNG ÂM VÀ ĐẶC TÍNH ÂM THANH. 8
2.1 Dao động âm và sự truyền dao động. 8
2.2 Đơn vị vật lý của âm thanh. 9
2.3. Đặc tính sinh lý về sự cảm thụ âm. 12
CHƯƠNG 2. WAVE FILE. 16
I. MULTIMEDIA WINDOWS. 16
II. CẤU TRÚC WAVE FILE. 17 2.1 RIFF file. 17
 2.2 Cấu trúc File Wave. 17
III. ĐỌC RIFF FILES 21
CHƯƠNG 3. LÝ THUYẾT XỬ LÝ TÍN HIỆU SỐ 25
I. TÍN HIỆU VÀ HỆ THỐNG RỜI RẠC 25
 1. Giới thiệu 25
 2. Đáp ứng xung trong hệ TTBB 25
 3. Tính chất của tổng chập của hệ TTBB 26
 4. Hệ nhân quả 27
 5. Tính ổn định 27
 6. Phương trình sai phân tuyến tính hệ số hằng 28
 7. Biểu diễn các hệ rời rạc trong miền tần số 28
 8. Định lý lấy mẫu Shannon 30
II. PHÉP BIẾN ĐỔI FOURIER RỜI RẠC 30
1. Chuỗi Fourier rời rạc của tín hiệu rời rạc tuần hoàn 30
2. Biến đổi Fourier rời rạc của tín hiệu có độ dài hữu hạn 31
3. Phép biến đổi nhanh Fourier (FFT) 32
CHƯƠNG 4. GIỚI THIỆU VỀ MPEG. 33
I. GIỚI THIỆU. 33 1. MPEG là gì? 33 2. So sánh các chuẩn MPEG 33 3. Am thanh MPEG 34 4. Các khái niệm cơ bản 35
 5. Hoạt động 38
II. CÁC KHÁI NIỆM TRONG ÂM THANH MPEG 40 1. Lược đồ mã hóa Perceptual Sub-band 40 2. Giải thích hiệu qủa che (masking efficiency) 41
 3. Các lớp của âm thanh MPEG 43
III. CÁC THÔNG SỐ. 45
CHƯƠNG 5. CÁC GIẢI THUẬT NÉN ÂM THANH 50
I. LÝ THUYẾT THÔNG TIN 50
II. CÁC GIẢI THUẬT NÉN KHÔNG CÓ TỔN THẤT 51
 1. Mã hóa Huffman 51
 2. Mã hóa Huffman sửa đổi 53
 3. Mã hóa số học 54
 4. Giải thuật Lempel-Ziv-Welch (LZW) 55
III. CÁC GIẢI THUẬT NÉN CÓ TỔN THẤT 57
 1. Các phương pháp nén âm thanh đơn giản 57
 2. Nén âm thanh dùng mô hình âm tâm lý 57
 3. Nén âm thanh theo chuẩn MPEG 58
PHẦN II. THIẾT KẾ CHƯƠNG TRÌNH 60
CHƯƠNG 6. LƯU ĐỒ GIẢI THUẬT VÀ CẤU TRÚC DỮ LIỆU 61
I. SƠ ĐỒ KHỐI. 61
II. CẤU TRÚC DỮ LIỆU VÀ ĐỊNH NGHĨA 62
A. CẤU TRÚC DỮ LIỆU 62
1. Các cấu trúc về file 62
2. Các cấu trúc về dòng bít dữ liệu 63
3. Các cấu trúc để định dạng dòng bít dữ liệu 63
4. Các cấu trúc huffmancodetab. 67
5. Các cấu trúc tính MDCT 67
6. Các cấu trúc scalefac_struct 67
B. CÁC ĐỊNH NGHĨA 68
1. Các định nghĩa dùng trong truy xuất dữ liệu 68
2. Các định nghĩa dùng trong tính toán FFT 68
3. Các định nghĩa dùng trong định dạng dòng dữ liệu 68
4. Các định nghĩa dùng trong bộ mã hoá Huffman 68
5. Các định nghĩa dùng trong phân tích dữ liệu 69
6. Các định nghĩa dùng trong mô hình âm tâm lý 69
7. Các định nghĩa dùng trong truy xuất nhập dữ liệu 69
8. Các định nghĩa dùng trong cấu trúc file Wave và file Mpeg 69
III. LƯU ĐỒ 71
CHƯƠNG 7: GIAO DIỆN VÀ THUYẾT MINH CHƯƠNG TRÌNH 75
I. GIỚI THIỆU 75
II. GIAO DIỆN 75
III.CHƯƠNG TRÌNH 77
TÀI LIỆU THAM KHẢO 87
 
 





Để tải tài liệu này, vui lòng Trả lời bài viết, Mods sẽ gửi Link download cho bạn ngay qua hòm tin nhắn.

Ket-noi - Kho tài liệu miễn phí lớn nhất của bạn


Ai cần tài liệu gì mà không tìm thấy ở Ket-noi, đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí

Tóm tắt nội dung tài liệu:


ới một vài điều chỉnh thích hợp, MPEG-1 và MPEG-2 làm việc rất tốt đối với HDTV.
MPEG-4 định nghĩa một tiêu chuẩn cho các ứng dụng Multi-media. Đặc biệt nó định nghĩa tiêu chuẩn truyền cho dòng phức tạp các hình ảnh, âm thanh và dữ liệu đồ hoạ và việc tái hợp chúng trên thiết bị thu. MPEG-4 được phát triển theo 2 giai đoạn, 1 và 2. Chuẩn MPEG-4 định nghĩa các đối tượng hình ảnh mà trong đó các phần của một cảnh có thể được thao tác trong khi những phần khác vẫn không đổi.
MPEG-5 và MPEG-6 vẫn chưa được công bố.
MPEG-7 định nghĩa một tiêu chuẩn về việc biểu diễn nội dung cho các nghiên cứu thông tin hình ảnh và âm thanh. Tên chính thức là “Multimedia Content Description Interface”. Mục tiêu của MPEG-7 là chuẩn hoá việc biểu diễn các mô tả về nội dung nghe nhìn. Tuy nhiên chuẩn không định nghĩa các công cụ để nhận ra nội dung nghe nhìn thật sự.
3. Âm thanh MPEG.
Khả năng của âm thanh MPEG, về cơ bản, âm thanh MPEG sẽ làm giảm kích thước lưu trữ 1 tâp tin âm thanh đi rất nhiều. Một đĩa Audio-CD lưu trữ được khoảng 650 Mbyte dữ liệu âm thanh thô với cách mã hóa 16 bit (bitdepth) và tần số lấy mẫu (sample rate) 44.1 kHz. Nếu đem phát ra thì cũng chỉ được 60 đến 72 phút.
- bitdepth: mô tả mức biên độ lớn nhất mà một mẫu âm thanh có thể đạt tới. Ví dụ: 8 bit = 256 mức, 16 bit = 65536 mức, về hình ảnh thì đó chính là độ phân giải.
- sample rate: mô tả số mẫu âm thanh được lấy trong 1 giây. Ví dụ: 22 kHz = 22.000 mẫu/1giây.
Phương pháp cổ điển để giảm kích thước lưu trữ là giảm lượng thông tin. Nếu đổi cách lưu trữ âm thanh từ 16 bit sang 8 bit chúng ta có thể giảm kích thước lưu trữ đi 1 nửa, tuy nhiên như thế chất lượng âm thanh cũng sẽ giảm đi 1 nửa.
Hình 4.1
4. Các khái niệm trong âm thanh MPEG.
a. Hiệu ứng che (masking): nói đơn giản là âm lớn át âm bé, âm mạnh át âm yếu.
b. Ngưỡng nghe và mức nhạy cảm.
· Thí nghiệm: đặt một người trong phòng yên tĩnh. Tăng mức to của âm 1kHz lên cho đến ngay khi có thể nghe được rõ ràng. Lặp lại thí nghiệm với các tần số khác nhau, ta vẽ được đồ thị sau:
Hình 4.2
· “Ngưỡng nghe” : là mức mà dưới nó 1 âm thanh không thể nghe được. Nó thay đổi theo tần số âm thanh, và dĩ nhiên giữa mỗi người khác nhau. Hầu hết mọi người đều nhạy cảm ở mức 2 đến 5 kHz. Một người có nghe được âm thanh hay không tùy thuộc vào tần số của âm và độ to của âm đó ở trên hay dưới ngưỡng nghe tại tần số đó. Tai nhạy cảm ở mức 2 đến 5 kHz .
· Ngưỡng nghe cũng có tính thích nghi, thay đổi cố định bởi âm thanh mà ta nghe được. Ví dụ, một cuộc nói chuyện bình thường trong một phòng thì có thể nghe được rõ ràng ở điều kiện bình thường. Tuy nhiên, cũng cuộc trò chuyện đó nằm trong vùng lân cận của những tiếng ồn lớn, như là tiếng ồn do một chiếc phản lực bay ngang bên trên, là hoàn toàn không thể nghe được do lúc này ngưỡng nghe đã bị sai lệch. Khi chiếc phản lục đã đi rồi thì ngưỡng nghe trở lại bình thường. Aâm thanh mà ta không thể nghe được do sự thích nghi động của ngưỡng nghe gọi là bị “che” (masked).
c. Che tần số (Frequency Masking)
Thí nghiệm:
· Phát ra 1 âm có tần số 1 kHz với mức to cố định là 60dB, gọi là “âm che” (masking tone). Phát ra một âm khác (gọi là test tone) ở mức tần số khác (ví dụ 1.1kHz), và tăng mức to của âm này cho đến khi có thể nghe được nó (phân biệt được âm 1.1 kHz và âm che 1kHz).
· Làm lại thí nghiệm với các âm thử (test tone) và vẽ ra một ngưỡng mà tại đó các âm thử bắt đầu có thể phân biệt được:
Hình 4.3
· Làm thí nghiệm với các “masking tones” có các tần số khác nhau, ta có được hình vẽ:
Hình 4.4
d. Che nhất thời. (che thời gian)
· Nếu ta nghe một âm thanh lớn, rồi ngưng nó lại, mãi một lúc sau ta mới có thể nghe được một âm lân cận nhỏ hơn .
· Thí nghiệm: phát ra một âm che “masking tone” có tần số 1kHz ở mức 60dB, kèm một âm thử (test tone) 1.1kHz ở mức 40dB. Ta không nghe được âm thử này (nó đã bị che).
Dừng âm che lại, đợi một lúc (delay time) ta dừng tiếp âm thử (test tone).
Điều chỉnh thời gian delay để cho ta vừa có thể nghe được âm chủ (ví dụ khoảng 5ms).
Lặp lại thí nghiệm cho các mức to khác nhau của âm thử, ta vẽ được đồ thị sau:
Hình 4.5
· Làm thí nghiệm tương tự với các tần số khác nhau cho âm thử. Hiệu qủa che được vẽ như hình.
Hình 4.6
5. Hoạt động:
· Khi đưa ra phương pháp mã hóa âm thanh, nền tảng vẫn là yếu tố “hệ thống nghe” của con người. Thật không may đó không phải 1 thiết bị hoàn hảo để nhận biết âm thanh nhưng là thiết bị duy nhất chúng ta có được. Nhưng chúng ta có thể chuyển những khuyết điểm của nó thành ưu điểm : đó là đặc tính phi tuyến của ngưỡng nghe và khả năng thích hợp của nó.
· MPEG hoạt động dựa trên hệ thống nghe của con người, đó là cảm giác về âm mang đặc tính sinh lý và tâm lý.
· Aâm thanh CD ghi lại tất cả tần số, kể cả những tần số bị ‘che’.
· Aâm thanh MPEG chỉ ghi lại những tần số mà tai người có thể nghe.
· Như vậy, MPEG sẽ bỏ qua những thông tin không quan trọng. Dựa trên nghiên cứu về nhận thức âm thanh của con người, bộ mã hóa sẽ quyết định những thông tin nào là căn bản và những thông tin nào có thể bỏ qua.
· Hiệu qủa này là bao quát nhưng đặc biệt quan trọng trong âm nhạc. Nếu trong một dàn nhạc có một nhạc cụ chơi cực mạnh, làm át tiếng của các nhạc cụ khác ta không thể nghe được. Nhưng máy thâu âm vẫn ghi lại đầy đủ tất cả tần số của tất cả nhạc cụ, nghĩa là thiết bị thâu âm hoàn toàn không có khả năng thích nghi động như con người. Nhưng khi phát lại, ta vẫn không nghe được âm thanh của những nhạc cụ bị át. Vì vậy việc lưu trữ/ghi lại những tần số này là thừa, làm chiếm dung lượng khá nhiều. Cách ghi âm tuyến tính trên đĩa CD là hoàn toàn không hiệu qủa về khía cạnh này. Do đó thay vì phải ghi lại thông tin của những âm không nghe được, ta sẽ dành chỗ cho các âm có thể nghe được. Theo cách này, dung lượng của thiết bị ghi âm cần thiết có thể xem như giảm đi mà không làm giảm chất lượng âm thanh.
· Trước khi chúng ta nghe được điều gì, thông tin sẽ được phân tích bởi bộ não của chúng ta. Não bộ sẽ dịch âm thanh và lọc bỏ những thông tin không cần thiết. Kỹ thuật âm thanh MPEG làm việc này thay thế cho não bộ. Như vậy, những thông tin lẽ ra phải được lọc bởi não bộ bây giờ không còn cần lưu trữ chiếm giữ không gian đĩa nữa.
II. CÁC KHÁI NIỆM CƠ BẢN VỀ MPEG.
1. Lược đồ mã hóa Perceptual Subband.
Bộ mã hóa âm thanh theo “perceptual subband” phân tích liên tục các tín hiệu vào và xác định ra đường cong che (masking curve), đó là mức ngưỡng mà những âm thanh ở dưới nó không thể nghe được bởi hệ thống nghe của con người.
Hình 4.7
Tín hiệu vào được chia thành 1 số dải tần số, gọi là “subband”. Mỗi tín hiệu “subband” được lượng tử hóa theo cách mà sự lượng tử hóa tiếng ồn được bắt đầu bởi việc mã hóa sẽ không vượt qúa đường cong che của subband đó. Sự lượng tử hóa phổ tiếng ồn vì thế thích nghi động với phổ của tín hiệu.Thông tin trên bộ số hóa được dùng trong mỗi subband được truyền dọc theo các mẫu subband được mã hóa. Bộ giải mã sẽ giải mã dòng bit...
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status