Trước khi chúng ta nói về các định dạng âm thanh hàng ngày, điều quan trọng là bạn hiểu những điều cơ bản và điều đó có nghĩa là hiểu PCM. Sau đó, chúng tôi sẽ giải quyết các định dạng nén.
Âm thanh PCM: Tất cả bắt đầu từ đâu
Pulse-Code Modulation được tạo ra vào năm 1937 và là xấp xỉ gần nhất của âm thanh analog. Đó là, một dạng sóng tương tự là xấp xỉ trong khoảng thời gian đều đặn. PCM được đặc trưng bởi hai đặc tính: tốc độ lấy mẫu và độ sâu bit. Tỷ lệ mẫu đo tần suất (tính bằng giây trên giây) biên độ của dạng sóng được lấy và độ sâu bit đo các giá trị số có thể. Xét về định dạng âm thanh, đây là nền tảng khá nhiều.
Âm thanh chân thực, trong thế giới thực, là liên tục. Trong thế giới kỹ thuật số, nó không phải. Bằng cách nào đó điều này gây nhầm lẫn với âm thanh hơn là video, vì vậy hãy xem video như một điểm so sánh. Những gì chúng tôi giải thích là "chuyển động" hoặc nghĩ về "chất lỏng" và liên tục di chuyển, trong thực tế, một loạt các hình ảnh tĩnh. Trong cùng một cách, biên độ của sóng âm thanh ở định dạng kỹ thuật số không phải là "chất lỏng" hoặc liên tục thay đổi. Nó thay đổi dựa trên các tiêu chí nhất định trong khoảng thời gian được xác định trước.
Hình ảnh từ Wikipedia
Tôi biết có rất nhiều thứ ở đây có thể không phải là bản chất thứ hai trừ khi bạn là kỹ sư, nhà vật lý hoặc người đam mê âm thanh, vì vậy hãy chia sẻ nó với một sự tương tự.
Giả sử rằng nước chảy từ vòi mở là nguồn âm thanh “tương tự” của bạn. Nhiệt độ của nước chúng ta có thể so sánh với biên độ của sóng âm; đó là một tài sản cần được đo để bạn có thể thưởng thức nó một cách chính xác. Lấy mẫu là số lần mỗi giây bạn nhúng ngón tay vào nước chảy. Bạn thường xuyên nhúng ngón tay vào đó, nhiệt độ càng "liên tục" thay đổi nhiệt độ. Nếu bạn dính ngón tay vào nước đang chảy 44,100 lần mỗi giây, nó gần giống như giữ ngón tay của bạn dưới đó suốt thời gian đó, đúng không? Đó là ý tưởng cơ bản đằng sau việc lấy mẫu.
Độ sâu bit là một chút phức tạp hơn. Thay vì sử dụng ngón tay của bạn, giả sử bạn đã sử dụng nhiệt kế thực sự. Về cơ bản nó nói "Nóng" cho bất cứ điều gì ở trên nhiệt độ phòng và "Lạnh" cho bất cứ điều gì dưới đây. Bất kể bao nhiêu lần bạn nhúng nó vào trong nước, nó sẽ không thực sự cung cấp cho bạn nhiều thông tin hữu ích. Bây giờ, nếu thay vì chỉ 2 lựa chọn, giả sử nhiệt kế có 16 giá trị có thể mà bạn có thể sử dụng để đo nhiệt độ nước. Hữu ích hơn, phải không? Độ sâu bit hoạt động theo cùng một cách, trong đó giá trị cao hơn cho phép thay đổi năng động hơn trong biên độ âm thanh được mô tả chính xác.
Như đã đề cập, PCM là nền tảng cho âm thanh kỹ thuật số, cùng với các biến thể của nó. PCM cố gắng để mô hình hóa một dạng sóng, trong càng nhiều vinh quang không nén của nó càng tốt. Nó đặc biệt, nó đã sẵn sàng để bị mắc kẹt trong một bộ xử lý tín hiệu kỹ thuật số, và nó có thể chơi nhiều hơn hoặc ít phổ biến hơn. Hầu hết các định dạng khác thao tác âm thanh qua thuật toán, vì vậy chúng cần phải được giải mã trong khi phát. Âm thanh PCM được coi là "không mất dữ liệu", nó không nén và do đó chiếm nhiều không gian ổ đĩa cứng.
Bunch không nén: WAV, AIFF
Hình ảnh của codepo8
Cả WAV và AIFF là các định dạng vùng chứa âm thanh không bị mất dựa trên PCM, với một số thay đổi nhỏ về lưu trữ dữ liệu. Âm thanh PCM, đối với hầu hết mọi người, có các định dạng này, tùy thuộc vào việc bạn sử dụng Windows hay OS X, và chúng có thể được chuyển đổi thành và từ nhau mà không làm giảm chất lượng. Cả hai đều được coi là "không mất dữ liệu", không nén và tệp âm thanh PCM stereo (2 kênh), được lấy mẫu ở 44,1 kHz (hoặc 44100 lần mỗi giây) ở mức 16 bit (“chất lượng CD”) khoảng 10 MB mỗi phút. Nếu bạn đang quay ở nhà với mục đích pha trộn, đây là những gì bạn muốn sử dụng vì nó có chất lượng đầy đủ.
Hình ảnh của CyboRoZ
Định dạng Lossless: FLAC, ALAC, APE
Codec Audio Lossless miễn phí, Codec âm thanh lossless của Apple và âm thanh của Monkey là tất cả các định dạng nén âm thanh, nhiều trong cùng một kiểu mà mọi thứ được nén trong thế giới kỹ thuật số: sử dụng thuật toán. Sự khác biệt giữa các tệp nén và tệp FLAC là FLAC được thiết kế đặc biệt cho âm thanh và do đó có tỷ lệ nén tốt hơn mà không làm mất dữ liệu. Thông thường, bạn đang thấy khoảng một nửa kích thước của WAV. Tức là, một tệp FLAC cho âm thanh nổi ở “chất lượng CD” chạy khoảng 5 MB mỗi phút.
Mặt tích cực là nếu bạn muốn thực hiện thao tác âm thanh, bạn có thể chuyển đổi lại thành WAV mà không làm giảm chất lượng. Nếu bạn là người đam mê âm thanh và nghe nhiều nhạc với các phạm vi động, các định dạng này là dành cho bạn. Nếu bạn có bộ loa, lon hoặc tai nghe tuyệt vời, các định dạng này sẽ hiển thị các tông màu để giới thiệu chúng.
Định dạng bị mất: MP3, AAC, WMA, Vorbis
Hình ảnh của patrick h lauke
Hầu hết các định dạng mà bạn nhìn thấy trong sử dụng hàng ngày là "mất mát"; một số mức độ chất lượng âm thanh được hy sinh để đổi lấy mức tăng đáng kể về kích thước tệp. MP3 trung bình "chất lượng CD" chạy khoảng 1 MB mỗi phút. Sự khác biệt lớn so với PCM, phải không? Điều này được gọi là nén, nhưng không giống như với các định dạng không mất dữ liệu, bạn không thể thực sự nhận được chất lượng đó khi bạn xóa nó ở định dạng mất dữ liệu. Các định dạng mất mát khác nhau sử dụng các thuật toán khác nhau để lưu trữ dữ liệu và do đó chúng thường khác nhau về kích thước tệp cho chất lượng tương đương. Định dạng mất dữ liệu cũng sử dụng tốc độ bit để tham chiếu đến chất lượng âm thanh, thường có dạng “192 kbit / s” hoặc “192 kbps.” Số cao hơn có nghĩa là nhiều dữ liệu hơn đang được bơm ra, vì vậy sẽ có nhiều chi tiết hơn về bảo quản. Dưới đây là một số chi tiết cho các định dạng phổ biến hơn.
- MP3: MPEG 1 Audio Layer 3, codec âm thanh lossy phổ biến nhất hiện nay. Mặc dù có rất nhiều vấn đề về bằng sáng chế, nó vẫn rất phổ biến. Ai không có MP3 nằm xung quanh?
- Vorbis: Một định dạng lossy miễn phí và mã nguồn mở được sử dụng thường xuyên hơn trong các game PC như Unreal Tournament 3. Những người hâm mộ FOSS, chẳng hạn như nhiều người dùng Linux, nhất định sẽ thấy rất nhiều định dạng này.
- AAC: Mã hóa âm thanh nâng cao, định dạng chuẩn được sử dụng với video MPEG4. Nó được hỗ trợ rất nhiều vì khả năng tương thích với DRM (ví dụ: Apple FairPlay), cải tiến trên mp3 và vì không cần giấy phép để phát hoặc phân phối nội dung ở định dạng này. Người hâm mộ Apple có lẽ sẽ có nhiều thứ trong AAC.
- WMA: Windows Media Audio, định dạng âm thanh bị mất của Microsoft. Nó được phát triển và sử dụng để tránh các vấn đề cấp phép với định dạng MP3, nhưng do những cải tiến lớn và khả năng tương thích DRM, cũng như việc triển khai không mất dữ liệu, nó vẫn còn tồn tại. Nó thực sự phổ biến trước khi iTunes trở thành nhà vô địch của âm nhạc DRMed.
Định dạng bị mất là những gì bạn sử dụng cho tất cả nội dung bạn nghe và lưu trữ. Chúng được thiết kế để trở thành nền kinh tế của không gian ổ đĩa cứng. Định dạng nào bạn chọn tùy thuộc vào loại trình phát âm thanh kỹ thuật số bạn sử dụng, số lượng dung lượng bạn có, mức độ nitpicker chất lượng cao và một loạt các biến số. Ngày nay, máy tính sẽ chơi bất cứ thứ gì, hầu hết các trình phát âm thanh (ngoại trừ Apple, tất nhiên) sẽ thực hiện nhiều định dạng mất dữ liệu và ngày càng nhiều FLAC và APE. Apple dính vào MP3, ALAC và AAC.
Chất lượng âm thanh có chủ quan không?
Hình ảnh của jonchoo
Có rất nhiều biến ở đây, mọi người, đừng nhầm lẫn về điều đó. Phải mất một thời gian trước khi tôi định cư bằng cách sử dụng FLAC cho một số âm nhạc và MP3 320kbps cho phần còn lại. Điểm mà tôi đang cố gắng thực hiện là bạn nên thử nghiệm xem điều gì phù hợp nhất với bạn và âm nhạc của bạn, nhưng hãy lưu ý rằng khi thị hiếu của bạn thay đổi, nhận thức của bạn, thiết bị của bạn và tầm quan trọng của chất lượng cũng vậy.
Và tất cả những thứ này thậm chí còn phức tạp hơn khi bạn không chỉ nói về âm nhạc, mà còn về giọng nói, hiệu ứng âm thanh, tiếng ồn trắng và nâu, v.v. Có cả thế giới âm thanh ở đó, nên đừng nản lòng! Bằng cách tìm hiểu những gì bạn có thể và lắng nghe cho chính mình, bạn có thể sử dụng thông tin này để lợi thế của bạn trong các dự án âm thanh trong tương lai của bạn. Tôi sẽ để lại cho bạn một số lời khuyên tốt nhất mà tôi từng nhận được: "làm những gì chỉ đơn giản là âm thanh tốt."