Gần đây, hai gã công nghệ khổng lồ Meta và Microsoft đã hợp tác và cùng nhau phát triển Llama 2 mới. Đây là một mô hình AI ngôn ngữ lớn thế hệ tiếp theo và theo thông tin nó có thể là AI tạo nhạc từ văn bản. Nhờ mô hình AI này, Meta có thể mang đến nhiều tính năng thú vị hơn nữa cho người dùng của mình.
AI tạo nhạc từ văn bản có tên là AudioCraft
Trong một bài đăng trên blog của mình, Meta đã giới thiệu công cụ AI mới nhất có tên là AudioCraft. Theo công ty, AI tạo nhạc này sẽ có khả năng tạo ra âm thanh và âm nhạc mang tính trung thực và chất lượng nhất từ văn bản. Meta cũng nói thêm rằng, công cụ này sẽ giúp các chủ doanh nghiệp nhỏ thêm nhạc nền vào video quảng cáo mới nhất của mình trên Instagram một cách dễ dàng và tăng phần thú vị, độc đáo hơn cho video.
Vì vậy, điều này cũng có nghĩa là người dùng không cần chờ đợi trong nhiều giờ để duyệt qua các bài hát khác nhau trước khi đăng lên Story. Hay mất thời gian tìm kiếm một bài hát phù hợp. Giờ đây, bạn chỉ cần viết ra loại nhạc mình cần và công cụ AI sẽ tạo ra loại nhạc đó theo yêu cầu của bạn. Nhưng không biết các ca sĩ sẽ cảm thấy như thế nào về AI tạo nhạc mới này.
AudioCraft vẫn chưa được triển khai trên bất kỳ nền tảng mạng xã hội nào do Meta sở hữu. Nhưng đây chỉ là vấn đề thời gian, có lẽ Meta sẽ cần phải tối ưu hoá công cụ AI tạo nhạc này trước khi cho nó thành tính năng mà người dùng sử dụng hàng ngày.
Hiện tại, Meta đang phát hành AudioCraft dưới dạng mã mở nguồn. Công ty cho biết rằng mục tiêu của họ là cho phép các nhà nghiên cứu và học viên phát triển các mô hình riêng bằng bộ dữ liệu của họ. Qua đó, thúc đẩy lĩnh vực âm thanh và âm nhạc do AI tạo ra.
Các thông tin chi tiết về AI tạo nhạc – AudioCraft
AudioCraft là một tập hợp gồm có ba mô hình, đó là MusicGen, AudioGen và phiên bản cải tiến của EnCodec. Trong đó, MusicGen là mô hình tạo ra âm thanh và được thiết kế để tạo ra nhạc. Nó được đào tạo trên một bộ dữ liệu lớn có khoảng 400.000 bản ghi âm nhạc. Các bản ghi đó bao gồm mô tả văn bản và siêu dữ liệu, tổng cộng 20.000 giờ âm nhạc do chính Meta sở hữu hoặc cấp phép để phục vụ cho các mục đích cụ thể này.
AudioGen là một mô hình AI sở hữu khả năng tạo văn bản thành âm thanh. Bằng cách nhập các mô tả chi tiết về âm thanh, công cụ này có thể tạo ra âm thanh môi trường thực tế phù hợp với mô tả. Và hoàn chỉnh với các bối cảnh phức tạp, đồng thời mang đến điều kiện ghi âm sống động như thật. Còn về bộ giải mã EnCodec, nó có khả năng đảm bảo nhạc đạt chất lượng cao hơn và có ít sự cố hơn.
Theo Meta, họ cần đổi mới có trách nhiệm và mang đến những trải nghiệm tốt nhất, vì vậy, không thể để mọi thứ diễn ra một cách độc lập. Gã khổng lồ công nghệ cũng cho biết thêm rằng bộ dữ liệu đào tạo mẫu của họ hiện đang thiếu sự đa dạng, đặc biệt là về phong cách âm nhạc và ngôn ngữ. Vì vậy, thông qua việc chia sẻ mã của AudioCraft, Meta mong muốn rằng các nhà nghiên cứu khác sẽ có những phương pháp thử nghiệm mới để có thể giảm sai lệch và lạm dụng trong mô hình nói chung.
Meta còn chia sẻ thêm rằng họ sẽ rất vui khi thấy những kết quả sáng tạo mà mọi người đã tạo ra dựa trên phương pháp của họ. Giờ đây, bạn có thể nghe được hàng trăm mẫu nhạc đa dạng các thể loại mà công cụ AI tạo nhạc mang đến. Ví dụ như nhạc disco thập niên 80 hay là nhạc cụ jazz như người đàn ông đang nói chuyện với nhiều người cổ vũ trong nhạc nền. Tất cả đều sẽ được Meta mang đến trong AI tạo nhạc thú vị này.
Kết luận
AI tạo nhạc mới của Meta hiện đã được công ty chính thức công bố nhưng họ vẫn chưa đề cập đến ngày ra mắt trên ứng dụng của họ. Có lẽ nó sẽ sớm xuất hiện trong năm nay. Hãy cùng chờ đón nhé!
Xem thêm các bài viết khác tại: mangasieuquay.vn