Sản phẩm này “đỉnh” đến mức gã khổng lồ công nghệ Mỹ không có ý định tích hợp nó vào sản phẩm hoặc mở rộng quyền truy cập của công chúng, do lo ngại “nguy cơ tiềm ẩn” về việc sử dụng cho mục đích xấu.
💥 ĐỌC RỒI, XEM RỒI > chán mắt quá rồi , tìm hiểu ngay đây >> Video chủ đề AI với các đề tài nóng nhất cùng Công nghệ AI đỉnh cao << tại đây nhé !
Công cụ có tên VALL-E 2, giúp chuyển văn bản thành giọng nói hoặc bắt chước giọng nói chỉ dựa trên vài giây âm thanh. Hệ thống được đào tạo để nhận dạng các khái niệm mà không cần cung cấp bất kỳ ví dụ nào về các khái niệm đó.
“VALL-E 2 là robot đầu tiên đạt được “sự tương đương với con người”, nghĩa là nó đáp ứng hoặc vượt qua các tiêu chuẩn về độ giống con người” – Microsoft tuyên bố.
VALL-E 2 kế thừa hệ thống VALL-E ban đầu được công bố vào tháng 1-2023.
![[Khoa học công nghệ] Sợ hãi với AI tạo giọng nói giống hệt con người [Khoa học công nghệ] Sợ hãi với AI tạo giọng nói giống hệt con người](https://nld.mediacdn.vn/291774122806476800/2024/7/18/ai-1721307756247200046618.jpeg)
![[Khoa học công nghệ] Sợ hãi với AI tạo giọng nói giống hệt con người [Khoa học công nghệ] Sợ hãi với AI tạo giọng nói giống hệt con người](https://nld.mediacdn.vn/291774122806476800/2024/7/18/ai-1721307756247200046618.jpeg)
Microsoft từ chối phát hành VALL-E 2 do lo ngại người dùng sử dụng nó cho mục đích xấu. Ảnh: The Sun
“VALL-E 2 có thể tạo ra giọng nói chính xác, tự nhiên theo đúng giọng của người nói gốc” – các nhà phát triển tại Microsoft Research quả quyết và cho biết công cụ này có thể tổng hợp các câu phức tạp.
Sở dĩ VALL-E 2 này có khả năng “như con người” nhờ tích hợp hai tính năng chính, gồm tính năng lấy mẫu có nhận thức về sự lặp lại và mô hình mã hóa theo nhóm.
Trong đó, tính năng lấy mẫu có nhận thức về sự lặp lại giúp giải quyết được các lần lặp lại của các đơn vị ngôn ngữ nhỏ như từ hoặc thành phần của từ; ngăn chặn các vòng lặp vô hạn của âm thanh hoặc cụm từ trong quá trình giải mã.
Còn mô hình mã nhóm giúp cải thiện hiệu quả bằng cách giảm độ dài chuỗi hoặc số lượng mã thông báo riêng lẻ, mà mô hình xử lý trong một chuỗi đầu vào duy nhất. Qua đó, có thể tạo ra giọng nói và giúp quản lý những khó khăn với việc xử lý chuỗi âm thanh dài.
Các thí nghiệm được tiến hành trên các tập dữ liệu LibriSpeech và VCTK đã chỉ ra rằng VALL-E 2 vượt trội hơn các hệ thống TTS zero-shot trước đây về độ mạnh mẽ của giọng nói, độ tự nhiên và độ tương đồng của người nói.
Các nhà nghiên cứu cho rằng rằng chất lượng đầu ra của VALL-E 2 phụ thuộc vào độ dài và chất lượng của lời nói cũng như các yếu tố môi trường, như tiếng ồn xung quanh.
Các nhà nghiên cứu nhận định trong tương lai, VALL-E 2 có thể tổng hợp giọng nói, duy trì được danh tính của người nói. Hơn nữa, nó có thể được sử dụng cho mục đích học tập, giáo dục, giải trí, báo chí, nội dung tự biên soạn, tính năng trợ năng, hệ thống phản hồi bằng giọng nói tương tác, dịch thuật, chatbot…
– Có thể bạn chưa biết ! Cân Điện Tử Công Nghiệp chuyên sản xuất và nhập khẩu và phân phối các loại cân điện tử siêu thị in nhãn hàng đầu tại Tp. Hồ Chí Minh. Hãy đến ngay website thiết bị đo lường của chúng tôi và trải nghiệm sản phẩm cân và thiết bị cân. Sản xuất và kinh doanh với sản phẩm cân điện tử và thiết bị đo lường
– Chuyên mục Khoa học và công nghệ [Khoa học công nghệ] Sợ hãi với AI tạo giọng nói giống hệt con người Chuyên trang tin tức cập nhật mới nhất tại Tin mới khoa học công nghệ phân phối tin khoa hoc công nghệ. Nhịp thở khoa học hiện đại công nghệ và đổi mới sáng tạo Hoạt động khoa học và công nghệ là hoạt động nghiên cứu khoa học trải nghiệm thực tế với khoa học. – Tác phẩm và quyền tác giả GHI tại Đầu hoặc/và Cuối chân mỗi trang/bài viết. tác phẩm : [Khoa học công nghệ] Sợ hãi với AI tạo giọng nói giống hệt con người, cấp phát bởi báo điện tử Người Lao Động – NLD tại mục Khoa học công nghệ, theo chấp nhận số (NLD02/2023) – Tuân thủ Giấy phép Creative Commons (CC = BY-SA-NC).
* Website Tin tứ phương chuyên mục Khoa học và công nghệ là phi lợi nhuận và không chịu bất cứ trách nhiệm nào với nội dung đang phân phối – có ghi nguồn.
* Quảng cáo chất lượng cao !