Hướng dẫn ghi âm cho YouTube, Podcast và phát trực tuyến
Giọng nói của con người là một công cụ độc đáo và phức tạp – không chỉ khi hát mà cả khi nói. Cho dù bạn đang ghi âm hộp thoại cho podcast, kênh YouTube hay luồng Twitch của mình, thì việc nắm bắt, chỉnh sửa và trộn giọng một cách chính xác để nghe có vẻ dễ hiểu, đầy đủ và tự nhiên có thể là một thách thức. Ngoài ra, bạn có thể không có thời gian, ngân sách và (thành thật mà nói) mong muốn làm bất kỳ điều gì khác ngoài bản ghi ban đầu.
Xem thêm:
Trong bài viết này, tôi sẽ trình bày cách tạo ra một hộp thoại nghe hay nhất có thể với nguồn tài nguyên hạn chế.
Giọng nói
Hãy bắt đầu với tổng quan nhanh về điều quan trọng nhất mà người ta cần hiểu khi ghi âm giọng nói của con người: chính giọng nói.
Lời nói và giọng hát là kết quả của một số thành phần khác nhau của cơ thể con người hoạt động song song với nhau. Một số âm thanh được tạo ra trong phổi và khoang ngực. Những người khác là kết quả của sự cộng hưởng của thanh quản (mà chúng ta còn gọi là “hộp giọng nói” của chúng ta), và những cái khác xảy ra cao hơn trong giải phẫu (nghĩ đến lưỡi, môi, v.v.).
Hai loại thành phần âm thanh quan trọng đối với giọng nói của con người, nhưng có thể gây ra các vấn đề khi ghi và trộn âm thanh: sibilance và plosives.
Âm thanh sibilant là những âm thanh sss, shhh và ch chắc chắn rất cần thiết cho sự dễ hiểu của lời nói. Khi ghi âm, âm thanh có thể được giảm thiểu bằng cách để người biểu diễn di chuyển ra xa micrô. Ngoài ra, bạn có thể thử đặt bút chì hoặc ngón tay trước môi của người biểu diễn. Tôi khuyên bạn nên để người biểu diễn sử dụng ngón tay của chính họ.
Tiếng nổ là do miệng tạo ra luồng hơi trong các từ như con người, quyền lực và làm ơn. Thật phù hợp khi từ plosives bắt đầu bằng chữ P, vì nó thường là thủ phạm tạo ra các loại tủ. Hãy tiếp tục và đặt lòng bàn tay của bạn cách miệng vài inch và nói một vài từ P, và bạn sẽ cảm thấy không khí bùng nổ mà tôi nói đến. Micrô không thích tiếng nổ và những âm thanh như vậy có thể làm hỏng bản ghi âm hoặc ít nhất, khiến chúng nghe không chuyên nghiệp. Khi ghi âm, một lần nữa có thể thu nhỏ các đoạn nhạc plosives bằng cách cho người biểu diễn lùi ra xa khỏi micrô. Bạn cũng có thể đặt micrô ở một góc (còn được gọi là ‘lệch trục’) từ miệng của người biểu diễn hoặc có thể sử dụng bộ lọc pop (đặt giữa miệng và micrô). Một bộ lọc pop phù hợp chỉ nên chạy từ $ 10 đến $ 30, nhưng nếu ngân sách eo hẹp, bạn có thể tự tạo.
Có lẽ lời khuyên quan trọng nhất mà bạn sẽ tìm thấy trong bài học này là hãy uống nước trước và nếu có thể, giữa các lần ghi hình. Ngoài việc có lợi cho sức khỏe nói chung, hydrat hóa là điều cần thiết để có một giọng nói dễ chịu. Khô miệng có thể khiến người biểu diễn khó phát âm một số từ nhất định và có thể giới thiệu đủ loại âm thanh tạo tác khó chịu như tiếng nhấp môi. Tôi hoàn toàn không thể đứng nghe những tiếng nhấp môi. Chúng có thể được gỡ bỏ tương đối dễ dàng trong quá trình trộn với plugin iZotope Mouth De-Click, nhưng tốt hơn hết là bạn nên tránh phần mềm khôi phục nếu có thể. Nước ở nhiệt độ phòng và các loại trà không chứa caffein là đồ uống ưu tiên của tôi được lựa chọn để sử dụng khi thu âm giọng nói của chính mình. Tôi tránh xa việc tiêu thụ caffein và rượu trước và trong khi ghi hình vì cả hai đều có xu hướng làm tôi mất nước, đôi khi khiến tôi bị uể oải.
Không có hai giọng nói nào giống hệt nhau và việc xác định và điều chỉnh cho phù hợp với đặc điểm giọng nói của đối tượng là điều cần thiết để có được các bản ghi âm lý tưởng.
Môi trường ghi âm
Trong trường hợp bạn không sản xuất nội dung cho kênh YouTube hoặc podcast của mình từ một studio được thiết kế chuyên nghiệp và xử lý âm thanh, điều quan trọng là phải tận dụng tối đa môi trường xung quanh bạn. Bạn sẽ chỉ có được một giọng nói dễ chịu cho đến nay nếu giọng nói đó được ghi lại trong một căn phòng có âm thanh vang và hang. Các phương tiện cải thiện âm học bao gồm sử dụng khả năng hấp thụ (thảm và tấm mềm), khuếch tán (tấm gỗ được thiết kế chính xác) và giảm thiểu cả hai bề mặt song song và phản xạ cao. Bạn sẽ ngạc nhiên về chất lượng ghi âm mà bạn có thể thu được trong sự thoải mái tại nhà riêng của mình với một số điều chỉnh tối thiểu và không tốn kém cho môi trường của bạn. Hãy xem xét một nghiên cứu điển hình.
Diễn viên hài kiêm diễn viên Marc Maron ghi lại podcast WTF của anh ấy với Marc Maron trong ga ra của ngôi nhà ở Los Angeles và nó nhận được hơn 220.000 lượt tải xuống mỗi tập – với hiện tại chương trình đã đạt hơn 100 triệu lượt tải xuống. Được cho là, dán micrô trước mặt các đối tượng bao gồm Robin Williams, Conan O’Brien và Helen Mirren sẽ dẫn đến một số nội dung hấp dẫn. Bất chấp điều đó, khi xem một bức ảnh chụp Marc phỏng vấn Barack Obama, tôi nhận thấy rất ít về cách xử lý âm thanh đắt tiền. Ở các góc phòng có bộ phận hấp thụ bọt, một tấm thảm lớn trên sàn, một giá sách dày đặc có thể hoạt động như một bộ khuếch tán và các tấm che được kéo lên cửa sổ để giảm thiểu phản xạ từ kính. Căn phòng trông đầy ắp (một số thậm chí có thể coi nó là lộn xộn). Có hàng tá bức tranh được treo trên tường, đĩa CD và cốc nằm rải rác trên bàn làm việc, máy in, guitar, đèn và những thứ khác xung quanh anh ấy. Các mục này đang giảm thiểu sự phản xạ của giọng nói có thể phát ra từ các bề mặt phẳng và đưa nó trở lại micrô.
Podcast của Marc Maron nghe thật tự nhiên. Nó không nguyên sơ tuyệt đẹp như một số podcast yêu thích khác của tôi, bao gồm Radiolab và Snap Judgment, nhưng tôi không bao giờ thấy mình bị phân tâm bởi chất lượng âm thanh. Có những cách ngân sách thấp để tạo ra một không gian khả thi giống như của anh ấy, và các phương pháp giảm âm thanh bao gồm sử dụng chăn, gối và thậm chí ghi âm trong tủ quần áo.
Điều quan trọng nữa là giảm thiểu những âm thanh không mong muốn phát ra trong bản ghi âm của bạn. Đảm bảo cửa ra vào và cửa sổ được đóng và giảm thiểu tiếng ồn từ máy lạnh và thiết bị điện tử khi đến thời điểm đạt kỷ lục. Phòng thu tại nhà của tôi không được cách âm 100%, vì vậy, tôi cần lưu ý về việc thỉnh thoảng có máy bay phản lực bay phía trên nhà tôi hoặc khi hàng xóm của tôi cắt cỏ.
Micro
Vì vậy, chúng tôi uống nước để giảm thiểu tiếng ồn từ miệng và phòng của chúng tôi được trang trí thích hợp để tránh dội âm. Gì bây giờ? Lựa chọn micrô phù hợp với túi tiền của bạn là điều cần thiết. Bên dưới, tôi sẽ vạch ra các kế hoạch hành động khác nhau tùy thuộc vào việc bạn sẽ ghi vào máy tính hay vào máy ảnh.
Nói một cách nhẹ nhàng về mặt khoa học, micrô là ví dụ của bộ chuyển đổi. Đây là những thiết bị chuyển đổi một dạng năng lượng này thành một dạng năng lượng khác. Micrô thu nhận năng lượng âm thanh do giọng nói của con người tạo ra và chuyển nó thành tín hiệu điện có thể được phương tiện ghi âm lưu trữ. Hai loại micro phổ biến nhất là micro tụ điện và micro điện động. Micrô ngưng tụ rõ ràng hơn, nhạy hơn và thường đắt hơn. Chúng cũng yêu cầu nguồn điện bên ngoài, được gọi là ‘ma lực’, để hoạt động. Micrô động có thể cho âm thanh kém sáng hơn và thu được ít môi trường hơn mà chúng đang được sử dụng.
Quay trở lại với Marc Maron’s WTF với Marc Maron, anh ấy đang sử dụng micrô Shure SM7B đã được thử nghiệm và thực sự, thuộc loại năng động. Chúng thực hiện một công việc tuyệt vời trong việc giảm thiểu (các) âm thanh của căn phòng mà chúng được đặt, khiến chúng trở thành lựa chọn tuyệt vời để ghi âm giọng nói trong một không gian được xử lý tối thiểu. Tôi cũng sử dụng micrô này cho các video hướng dẫn, kênh YouTube của tôi và cho các nhiệm vụ sản xuất âm nhạc nói chung. Chúng có giá khoảng 400 đô la, vì vậy tôi sẽ không giới thiệu chúng cho bất kỳ ai trừ khi họ thực sự nghiêm túc về việc tạo nội dung và cải thiện chất lượng bản ghi âm giọng hát của mình. Chúng cũng yêu cầu một bộ tiền khuếch đại micrô chất lượng cao (sẽ có nhiều hơn nữa trong thời gian ngắn) với mức khuếch đại tốt và chúng được hưởng lợi từ một số xử lý bổ sung bao gồm cân bằng và nén để thực sự đạt được tiềm năng âm thanh của chúng. Nếu bạn sẵn sàng thực hiện những khoản đầu tư nói trên, bạn có thể đạt được chất lượng phát sóng với Shure SM7B. Một micrô động rẻ hơn nhưng vẫn rất khả thi là Shure SM58.
Micrô tụ điện có màng ngăn lớn rất tuyệt vời khi sử dụng đúng nguồn và khi được sử dụng trong môi trường thích hợp. Tôi muốn giới thiệu micrô tụ màng lớn $ 3.200 Neumann U 87, chịu trách nhiệm một phần cho “âm thanh của NPR”, trừ khi bạn có một phòng thu được xử lý chuyên nghiệp để thu âm. Tuy nhiên, tôi sẽ cân nhắc đề xuất bộ ngưng tụ ngân sách chẳng hạn như Audio Technica AT2020 hoặc AT2035.
Một loại micrô tụ điện khác là micrô shotgun, trông hơi khác một chút so với các loại micrô có màng chắn lớn của chúng. Tương tự như các thiết bị ngưng tụ màng lớn, chúng có giá từ vài trăm đô la đến vài nghìn. Chúng được biết đến với các mẫu bán tải rất định hướng, có nghĩa là chúng được thiết kế để nắm bắt âm thanh của những gì chúng nhắm đến và từ chối mọi thứ khác. Vì lý do này, micrô shotgun được sử dụng phổ biến khi thu âm thanh sản xuất tại chỗ. Chúng cũng tương đối nhẹ và dễ di chuyển. Các công ty bao gồm Rode và Sennheiser sản xuất mic súng ngắn chất lượng cao.
Một lựa chọn hợp lý hơn và dễ sử dụng hơn cho những người ghi âm vào máy tính của họ là micrô USB. Chúng có nhiều loại và rất có thể chất lượng âm thanh của chúng vượt trội hơn so với micrô hoặc mic của máy ảnh được tích hợp trong máy tính để bàn hoặc máy tính xách tay. Blue Yeti là một micrô USB đơn giản và có thể sử dụng được.
Nếu bạn quyết định không sử dụng tuyến micrô USB, bạn sẽ cần xem xét giao diện ghi âm. Giao diện thường cung cấp cách kết nối micrô của bạn bằng cáp XLR. Nhiều giao diện sau đó sẽ được kết nối với máy tính của bạn qua USB. Điều mà trước đây chỉ có thể thực hiện được bằng cách sử dụng các bảng điều khiển ghi âm lớn, đắt tiền và khó bảo trì thì nay đã có thể thực hiện được với giao diện USB. Nói chung, chất lượng âm thanh sẽ tốt hơn khi sử dụng giao diện âm thanh so với micrô USB. Các giao diện thường cũng sẽ cung cấp nguồn ảo để vận hành micrô tụ điện. Có hàng trăm giao diện khác nhau, đa dạng về giá cả và chất lượng. Một lựa chọn chắc chắn và giá cả phải chăng cho các kỹ sư âm thanh, người phát trực tuyến và podcast đầy tham vọng là Focusrite Scarlett 2i2. Các giao diện như thế này được trang bị bộ tiền khuếch đại micrô giúp tăng mức đầu ra của micrô ở mức dễ chấp nhận hơn. Là một người thiết kế âm thanh chuyên nghiệp, tôi sử dụng Universal Audio Apollo x8p và không thể hạnh phúc hơn. Universal Audio tạo ra một số giao diện tuyệt vời với ngân sách thấp hơn, bao gồm cả Apollo Solo.
Nếu bạn định ghi trực tiếp vào máy ảnh của mình, có những micrô được thiết kế riêng cho mục đích này. Một ví dụ là Rode VideoMicro. Đây là một micrô shotgun nhỏ gọn
trau dồi mà sẽ gắn trực tiếp trên máy ảnh. Nó đi kèm với một kính chắn gió lông thú để giảm thiểu tiếng ồn của gió nếu bạn tình cờ quay phim bên ngoài và nó được trang bị một giắc cắm đầu ra tương thích với hầu hết các máy ảnh kỹ thuật số hiện nay. Hạn chế của việc ghi trực tiếp vào máy ảnh là tiền khuếch đại micrô thường có chất lượng thấp hơn so với tiền khuếch đại mà bạn tìm thấy trong giao diện âm thanh trên máy tính để bàn hoặc máy ghi âm di động.
Loa kiểm âm hoặc Tai nghe
Thiết bị bạn ghi âm cũng quan trọng như thiết bị bạn nghe, đặc biệt nếu cuối cùng bạn đang trộn podcast hoặc video YouTube của riêng mình.
Tại thời điểm ghi âm, tôi khuyên bạn nên sử dụng một bộ tai nghe phù hợp được kết nối với thiết bị ghi âm của bạn, cho dù đó là máy ảnh, giao diện âm thanh hay micrô USB (một số trong số đó có giắc cắm đầu ra mà bạn có thể cắm trực tiếp vào). Tai nghe tốt sẽ cho phép bạn nghe những gì người nghe / người xem của bạn sẽ nghe. Tôi đã sử dụng tai nghe Sennheiser HD280 hơn một thập kỷ nay và bạn sẽ khó tìm được bộ nào tốt hơn với giá 100 đô la.
Nếu bạn có khả năng kết hợp một số công việc, tai nghe tương tự cũng sẽ làm được, nhưng tôi cũng khuyên bạn nên sử dụng màn hình. Màn hình của bạn càng có độ nét và rõ ràng, bạn càng có thể đưa ra quyết định tốt hơn khi thực hiện các điều chỉnh. Các công ty như ADAM Audio, Focal và Genelec tạo ra những màn hình tuyệt vời. Tương tự như micrô, chúng có rất nhiều mức giá.
Phần mềm Sonarworks Reference 4 mang tính cách mạng có thể đi một chặng đường dài trong việc cải thiện cách màn hình hoạt động trong môi trường của bạn và tôi khuyên bạn nên sử dụng phần mềm này cho bất kỳ ai có kế hoạch trộn nội dung sáng tạo của họ trong một không gian kém lý tưởng.
Máy trạm âm thanh kỹ thuật số
Còn được gọi là DAW, một máy trạm âm thanh kỹ thuật số là thứ mà hầu hết các kỹ sư hiện đại sử dụng để ghi và trộn nhiều loại phương tiện khác nhau. DAW tiêu chuẩn ngành là AVID Pro Tools, nhưng có nhiều tùy chọn chức năng cao, giá cả phải chăng khác bao gồm Adobe Audition, Logic của Apple, Cubase của Steinberg và Studio One của Presonus. DAW miễn phí bao gồm Garageband, Audacity và Ableton Live Lite. Blue Yeti đi kèm với phần mềm độc quyền của riêng mình, Yeti Studio và cũng có thể được mua kèm theo Studio One.
Mỗi DAW có đường cong học tập, điểm mạnh và điểm yếu riêng. Nếu tất cả những gì bạn cần là ghi, chỉnh sửa và trộn hộp thoại, thì tất cả các phần mềm nói trên sẽ làm được.
Chuẩn bị kỹ lưỡng để sẵn sàng
Tại thời điểm này, micrô của bạn đã được thiết lập (tốt nhất là trên giá đỡ micrô) và được kết nối. Đừng quên nguồn ảo khi sử dụng micrô tụ điện. Ngoài ra, đừng đánh giá thấp tầm quan trọng của việc di chuyển cả chủ thể và micrô của bạn xung quanh phòng. Một số khu vực nhất định trong không gian của bạn có thể phản chiếu nhiều hơn và tôi khuyên bạn nên thực hiện các bài kiểm tra và sau đó lắng nghe lại trước khi xác định vị trí. Tất nhiên, nếu bạn đang phát trực tuyến cho Twitch, bạn có thể nhìn thấy bất cứ nơi nào mà trạm chiến đấu của bạn được thiết lập. Tôi vẫn khuyên bạn nên di chuyển những thứ xung quanh phòng của bạn có thể ảnh hưởng đến âm thanh. Có lẽ bạn có thể di chuyển một tấm chăn hoặc các loại giảm chấn khác phía sau micrô và máy ảnh. Một chút thử nghiệm và sai sót sẽ giúp ích cho chất lượng tổng thể.
Điều quan trọng là sử dụng độ lợi trên thiết bị ghi của bạn để kiểm soát lượng tín hiệu bạn muốn thu. Hầu hết các thiết bị ghi hình đáng giá (bao gồm cả máy ảnh) và DAW sẽ được trang bị đồng hồ đo, nằm trong khoảng từ-vô cực đến không. Chúng cho phép người dùng xem bao nhiêu tín hiệu sẽ được ghi lại. Một nguyên tắc chung là đặt mức khuếch đại sao cho mức trung bình là -18 dBFS. Điều quan trọng nhất là tránh để biên độ về không, có khả năng gây méo tiếng. Nếu bạn đang sử dụng DAW để thu âm thanh của mình, hãy đảm bảo rằng các đầu vào được định tuyến chính xác và bản nhạc của bạn được trang bị bản ghi.
Điều chỉnh âm thanh
Nếu bạn sẵn sàng dành thời gian và nỗ lực để thực hiện một số công việc sau khi nội dung của bạn đã được ghi lại, có rất nhiều công cụ tuyệt vời hiện có để đánh bóng âm thanh để nghe chuyên nghiệp hơn. Hãy cùng tóm tắt nhanh các loại bộ xử lý phổ biến nhất được sử dụng trên hộp thoại. Cần lưu ý rằng hầu hết các DAW cấp đầu vào sẽ đi kèm với các loại bộ xử lý này và nhiều công ty bên thứ ba cũng bán bộ xử lý của riêng họ.
- Bộ cân bằng – Bộ cân bằng là một trong những loại xử lý hiệu quả nhất mà các kỹ sư âm thanh sử dụng. Con người có thính giác lý tưởng có thể nhận biết các tần số nằm trong khoảng từ 20 Hz (20 chu kỳ mỗi giây) đến 20 kHz (20.000 chu kỳ mỗi giây). Bộ cân bằng cho phép người dùng tăng hoặc cắt ở các dải tần số nhất định trong dải tần này. Nếu giọng của bạn thiếu tần số thấp và nghe mỏng, bạn có thể sử dụng bộ cân bằng để làm dày giọng. Tôi làm cho giọng nói của mình trở nên đầy đủ hơn bằng cách thêm một chút vào giữa 100-150 Hz. Ngược lại, nếu giọng của bạn quá chói hoặc quá chói ở một số tần số nhất định, bạn có thể sử dụng bộ cân bằng để làm giảm vùng đó của phổ tần số. Tôi thường cắt bớt một chút ở tần số 600 Hz và 2 kHz trong giọng nói của mình. Bộ cân bằng cũng có thể được sử dụng để giảm thiểu tiếng ồn hoặc tiếng ồn không mong muốn, nhưng tác vụ đó phù hợp hơn với phần mềm khôi phục âm thanh.
- Máy nén – Máy nén làm giảm dải động của tín hiệu. Điều này có nghĩa là họ lấy phần ồn ào và phần yên tĩnh và đưa chúng lại gần nhau hơn. Hiệu ứng này có thể được sử dụng để đạt được âm thanh rất cân bằng.
- De-essers – Tôi đã dành hẳn một đoạn để nói về sibilance trước đó trong bài viết này, nhưng nếu bản ghi âm của bạn vẫn có những âm thanh sss không mong muốn, chói tai, một de-esser có thể giúp bạn. Đây là một loại máy nén chỉ ảnh hưởng đến khu vực phía trên của phổ tần số, do đó mức âm thanh giảm xuống và phần còn lại của tín hiệu không bị ảnh hưởng.
- Khôi phục âm thanh – Có thể có lỗ hổng trong âm thanh của bạn nằm ngoài phạm vi của các công cụ nói trên và tôi sẽ gộp nhiều loại công nghệ khác nhau mà chúng tôi sử dụng để khắc phục những sai sót đó vào danh mục khôi phục âm thanh. Tôi thường sử dụng bộ plugin iZotope RX 8 để xử lý những vấn đề này. Tôi đã đề cập đến plugin Mouth De-Click; nó cũng đi kèm với De-Wind, De-Rustle, De-Reverb và nhiều mô-đun khác làm rất tốt việc khắc phục các sự cố được đưa ra trong quá trình ghi. Mặc dù những công cụ này cực kỳ mạnh mẽ và đã cách mạng hóa quy trình hậu sản xuất, nhưng chúng có một đường cong học tập tương đối dốc và không thể thay thế cho kỹ thuật ghi âm thích hợp.
- Bộ hạn chế – Nói chung là một trong những công cụ cuối cùng được sử dụng trong sản xuất, bộ hạn chế là loại máy nén cực mạnh cho phép người dùng đặt mức trần mà biên độ sẽ không bao giờ vượt qua. Chúng có thể được sử dụng để nâng cao cấp độ tổng thể của hỗn hợp cuối cùng và ngăn chặn sự biến dạng hoặc cắt xén không mong muốn.
Ngoài các plugin này, chúng tôi có thể sử dụng tự động hóa để tăng và giảm âm lượng của hộp thoại để các cấp tổng thể đồng đều hơn.
Các dịch vụ phát trực tuyến khác nhau có các mục tiêu độ ồn khác nhau, thường được đo bằng ‘Đơn vị độ ồn Toàn thang đo (hoặc viết tắt là LUFS). Mục tiêu cho YouTube là -14 LUFS, vì vậy nếu bạn phân phối thứ gì đó thấp hơn mức đó, chẳng hạn -24 LUFS, YouTube sẽ tự động nâng cấp tổng thể lên với giá trị là 10 LUFS. Cả âm nhạc và các loại phương tiện khác đều có thể thay đổi nếu chúng không đáp ứng các yêu cầu này và tôi khuyên bạn nên đọc chủ đề này nếu bạn muốn biết cách phân phối các tệp sẽ nhận được điều chỉnh âm lượng tối thiểu khi tải lên tệp cuối cùng điểm đến.