Microsoft tạo AI có giọng nói giống người đến 99,84%

14/07/2020 09:00

MTNN Sử dụng một phần nguyên lý hoạt động của não người, Microsoft đã tạo ra trí thông minh nhân tạo AI có thể nói ngôn ngữ nhanh và chính xác hơn.

Các AI Text-to-speech đang ngày càng thông minh hơn, có khả năng nói tiếng người giống hơn từ một văn bản có sẵn. Tuy nhiên có một vấn đề là các AI này cần rất nhiều thời gian đào tạo, data dữ liệu lớn để có thể tạo ra một giọng nói dễ nghe.

Chính vì thế các nhà khoa học của Microsoft và Trung Quốc đã đưa ra một thuật toán mới, nhằm giúp xây dựng các AI nói trong tương lai hiệu quả hơn.

Nhóm nghiên cứu đã tạo ra một text-to-speech AI có thể nói mà chỉ cần 200 mẫu giọng nói (khoảng 20 phút thu âm) và phiên âm phù hợp.

AI mới này dựa một phần vào nguyên lý hoạt động gọi là Transformers, hay mạng lưới thần kinh sâu mô phỏng các tế bào thần kinh trong não người. Transformers "nặng" các thông tin đầu vào và đầu ra một cách nhanh chóng như liên kết khớp thần kinh, giúp họ xử lý chuỗi thậm chí kéo dài rất hiệu quả - nói, một câu phức tạp. Kết hợp Transformers với một thành phần mã hóa loại bỏ nhiễu và AI có thể làm được rất nhiều với tương đối ít data lưu trữ.

AI được hình thành có giọng nói không phải hoàn hảo lắm, với một âm thanh "hơi" robot, nhưng độ chính xác và dễ hiểu của chúng rất cao tới 99,84%.

Quan trọng là hệ thống này giúp chuyển văn bản thành giọng nói một cách nhanh chóng và đơn giản hơn. Các nhà lập trình không phải bỏ nhiều công sức để tạo ra tiếng nói ảo, giúp các công ty nhỏ, thậm chí là người nghiệp dư có thể tạo ra hệ thống giọng nói riêng.

Ái Vi (theo Engadget)

.

Nguồn
Link bài gốc

;
Bình luận
Họ tên :
Email :
Lời bình :
RadEditor - HTML WYSIWYG Editor. MS Word-like content editing experience thanks to a rich set of formatting tools, dropdowns, dialogs, system modules and built-in spell-check.
RadEditor's components - toolbar, content area, modes and modules
   
Toolbar's wrapper 
 
Content area wrapper
RadEditor's bottom area: Design, Html and Preview modes, Statistics module and resize handle.
It contains RadEditor's Modes/views (HTML, Design and Preview), Statistics and Resizer
Editor Mode buttonsStatistics moduleEditor resizer
 
 
RadEditor's Modules - special tools used to provide extra information such as Tag Inspector, Real Time HTML Viewer, Tag Properties and other.
   
Mobile
TieuDe
Nhập mã bảo mật :  
Gửi bình luận
     
Mới nhất | Cũ nhất
Không tìm thấy bản ghi nào

CÓ THỂ BẠN QUAN TÂM

Bạn đọc quan tâm

Tạo 'siêu bố' vật nuôi bằng chỉnh sửa gien

Lần đầu tiên các nhà khoa học đã tạo ra được “siêu bố” heo, dê và gia súc có chất lượng như mong muốn để gây giống vì chúng chỉ sản xuất tinh trùng mang đặc điểm di truyền của động vật hiến tặng.

Scroll

Kênh thông tin giới trẻ - gioitrenews.com