Thuật toán của Amazon tạo giọng nói tự nhiên cho các chương trình quảng cáo

11/02/2020 08:15

MTNN Thuật toán Brand Voice của Amazon giúp triển khai dịch vụ biến văn bản thành giọng nói tự nhiên, nghĩa là một bài quảng cáo theo mô hình máy tính sẽ phát ra âm thanh như thể một người nổi tiếng nào đó đã nói.

Theo Venture Beat, thuật toán Brand Voice thực hiện công việc nhanh hơn các diễn viên chuyên nghiệp. Amazon hy vọng rằng công ty sẽ có nhiều đơn hàng đặt phát triển giọng nói với bất kỳ loại giọng nói hoặc kiểu phát âm nào để quảng bá thương hiệu của họ.

Cụ thể, Amazon cùng với bộ phận AWS dựa trên thuật toán đám mây của mình đã ra mắt thuật toán Brand Voice, một dịch vụ biến văn bản thành giọng nói tự nhiên. Như các nhà quản lý dự án giải thích, các tổ chức sẽ có thể mang lại sự độc đáo cho thương hiệu của họ. Nói cách khác, một bài phát biểu quảng cáo theo mô hình máy tính sẽ phát ra âm thanh như thể một người nổi tiếng nào đó đã nói.

Amazon đã giúp chuỗi cửa hàng thức ăn nhanh của KFC ở Canada tạo ra tiếng nói với giọng Nam Mỹ điển hình của đại tá Sanders. Và đối với Ngân hàng quốc gia Úc, một giọng nói đã được phát triển với đặc điểm phát âm của cư dân xứ sở chuột túi. Các chi tiết kỹ thuật về quá trình giọng nói được tạo ra bởi trí tuệ nhân tạo đã được công bố trong bài viết "Effect of data reduction on sequence-to-sequence neural TTS" được công bố hồi năm ngoái. Trong đó, các tác giả đã mô tả một hệ thống học cách bắt chước cách phát âm mới chỉ trong vài giờ luyện tập chứ không phải trong hàng chục giờ như diễn viên phải luyện đọc để có được ngữ điệu cần thiết. Mô hình AI của Amazon gồm 2 thành phần. Đầu tiên là một mạng nơ ron phát triển tín hiệu âm thanh và một bộ phát âm theo phong cách trung tính được kết hợp với một lượng nhỏ lời nói theo phong cách mong muốn.

Trước đó, vào mùa thu năm ngoái, người ta đã biết về một vụ lừa đảo lớn bằng thuật toán học máy. Những kẻ tấn công đã sử dụng AI để giả giọng nói và mạo danh giám đốc của một công ty Đức để lừa đảo số tiền hơn 200.000 USD.

Vũ Trung Hương

Nguồn
Link bài gốc

;
Bình luận
Họ tên :
Email :
Lời bình :
RadEditor - HTML WYSIWYG Editor. MS Word-like content editing experience thanks to a rich set of formatting tools, dropdowns, dialogs, system modules and built-in spell-check.
RadEditor's components - toolbar, content area, modes and modules
   
Toolbar's wrapper 
 
Content area wrapper
RadEditor's bottom area: Design, Html and Preview modes, Statistics module and resize handle.
It contains RadEditor's Modes/views (HTML, Design and Preview), Statistics and Resizer
Editor Mode buttonsStatistics moduleEditor resizer
 
 
RadEditor's Modules - special tools used to provide extra information such as Tag Inspector, Real Time HTML Viewer, Tag Properties and other.
   
Mobile
TieuDe
Nhập mã bảo mật :  
Gửi bình luận
     
Mới nhất | Cũ nhất
Không tìm thấy bản ghi nào

CÓ THỂ BẠN QUAN TÂM

Robot lấy máu tĩnh mạch giỏi hơn y tá

Theo Rutgers Today, các nhà khoa học đã thử nghiệm thành công một robot tự tin lấy máu ngay cả từ các tĩnh mạch phức tạp. Và sau khi lấy máu, robot phân tích các mẫu. Trong tương lai, robot sẽ có thể thay thế y tá trong các thủ tục khác.

Bạn đọc quan tâm

Tạo 'siêu bố' vật nuôi bằng chỉnh sửa gien

Lần đầu tiên các nhà khoa học đã tạo ra được “siêu bố” heo, dê và gia súc có chất lượng như mong muốn để gây giống vì chúng chỉ sản xuất tinh trùng mang đặc điểm di truyền của động vật hiến tặng.

Scroll

Kênh thông tin giới trẻ - gioitrenews.com