Startup tung công nghệ giọng nói AI hệt như giọng người thật
Thu Thảo -
12/03/2019 15:09 (GMT+7)
Một video quảng cáo ngắn được đăng tải trên YouTube với hình ảnh người mẫu tóc vàng, trên nền nhạc và giọng nữ nói: “Thời trang thay đổi, nhưng phong cách tồn tại mãi”. Người mẫu là thật, song giọng nói thì không.
Startup tung công nghệ giọng nói AI hệt như giọng người thật. Ảnh: Shutterstock
Theo CNN, video quảng cáo này là một phần của bản thử video được WellSaid Labs đăng tải trên YouTube. Đoạn video gồm nhiều quảng cáo ngắn nhưng gây ấn tượng vì dù người mẫu là người thật nhưng giọng đọc quảng cáo thì không.
Doanh nghiệp có trụ sở ở Seattle (Mỹ) dùng nhiều diễn viên lồng tiếng và công nghệ trí tuệ nhân tạo (AI) để tạo ra giọng nói tổng hợp nghe hệt như giọng người. Công ty tuyên bố phần mềm chuyển văn bản thành giọng nói mà họ phát triển trong năm qua có thể tạo âm thanh giống giọng người hơn các giọng nói tổng hợp khác. Lý do là vì họ không kiểm soát chặt chẽ các biến số khác nhau của lời nói như tốc độ, phát âm và âm lượng khi đào tạo mô hình giọng nói.
CEO Matt Hocking của WellSaid Labs cho hay: “Giọng nói chúng tôi cố gắng tạo ra ở đây là siêu biểu cảm và giống như thật trong kết quả cuối cùng”.
Giọng nói được vi tính hóa dường như có mặt ở mọi nơi trong thời gian gần đây. Nó có trong chiếc loa thông minh trong phòng khách cho đến tính năng chỉ đường cho ô tô. Dù vậy, Alexa, Siri, Google Assistant và nhiều trợ lý ảo vẫn có giọng nói mang sắc thái robot, ngoại trừ Google Duplex, công cụ có thể gọi đến doanh nghiệp và trò chuyện bằng giọng kích hoạt AI nhấn nhá như giọng người.
Ảnh chụp màn hình đoạn video của WellSaid. Ảnh: YOUTUBE
WellSaid Labs không có ý định chiếm lĩnh thị trường trợ lý giọng nói. Doanh nghiệp kỳ vọng bán công nghệ giọng nói cho các công ty muốn sử dụng nó trong quảng cáo, tiếp thị và khóa học trên mạng. Hãng hiện xây dựng một số giọng nói mà khách hàng có thể sử dụng, kỳ vọng rằng hãng có thể hợp tác với nhiều diễn viên lồng tiếng để tạo ra vô số bộ dữ liệu khác nhau, có thể được dùng để tạo ra nhiều loại giọng nói nhân tạo.
Để tạo tiếng nói AI của người phụ nữ trong đoạn quảng cáo, trước hết WellSaid để một diễn viên lồng tiếng đọc nhiều bài viết từ Wikipedia. Những bản sao này tạo thành tập dữ liệu mà hãng dùng để huấn luyện mạng thần kinh nhân tạo, hay hệ thống máy tính có cấu trúc mô hình hóa lỏng lẻo theo nơ-ron thần kinh trong não người.
Startup cho hay họ không cần xử lý trước hoặc chú thích văn bản được cung cấp cho phần mềm để nó tạo ra giọng nói có ngữ điệu tự nhiên. Ngữ điệu như thật là điểm mà các giọng nói nhân tạo rất khó lòng thực hiện. Nếu người dùng nhập một đoạn văn bản vào phần mềm hai lần, họ sẽ nhận được hai kết quả khác nhau.
Giáo sư ngôn ngữ Alan Black tại Đại học Carnegie Mellon cho hay việc tạo giọng nói tổng hợp tốt liên tiếp là rất khó. Giọng nói trợ lý ảo như Alexa của Amazon là âm thanh robot vì thật khó để khiến âm thanh nghe mượt và tự nhiên trong mọi tình huống. Dù vậy, ông nghe giọng nói thử của WellSaid và cho rằng nó có vẻ “khá tốt”.
(VNF) - Trong khi nỗi lo về việc Trí tuệ nhân tạo (AI) “bóp nghẹt” ngành phần mềm đang đè nặng lên tâm lý giới đầu tư toàn cầu, quỹ ngoại NTAsset lại đưa ra một góc nhìn ngược lại: Đám đông có thể đang nhầm lẫn giữa việc “tạo ra phần mềm” và “triển khai công nghệ”.
(VNF) - iPhone Trump là một phiên bản đặc biệt được chế tác từ iPhone 17 Pro Max, nhưng nó không chỉ là sản phẩm công nghệ mà trở thành món trang sức xa xỉ.
(VNF) - Theo Bloomberg, SpaceX hiện đang hướng tới mức định giá tối thiểu khoảng 1,8 nghìn tỷ USD trong đợt phát hành cổ phiếu lần đầu ra công chúng (IPO) sắp tới.
(VNF) - Dù AI ngày càng được ứng dụng rộng rãi trong ngành tài chính và phần lớn chuyên gia tự tin sử dụng công nghệ này. Tuy nhiên, càng sử dụng AI càng khiến các chuyên gia tài chính lo lắng nhiều hơn về nguy cơ mất việc.
(VNF) - Nvidia đang đầu tư 6,2 tỷ USD vào một công nghệ mới nổi có thể thay đổi ngành công nghiệp trí tuệ nhân tạo. Trong khi đó, Foxconn cho biết, sẽ bắt đầu xuất xưởng các hệ thống quang học thế hệ mới phục vụ AI từ cuối năm nay, với một phần sản xuất được thực hiện tại Việt Nam.
(VNF) - CEO Nvidia Jensen Huang đặt cược lớn vào Đài Loan (Trung Quốc) trong cuộc đua AI toàn cầu khi nâng mức chi tiêu hằng năm tại đây lên tới 150 tỷ USD.
(VNF) - Cuộc lật đổ ngoạn mục trong ngành AI và tham vọng trở thành “gã khổng lồ” tiếp theo của Thung lũng Silicon, Anthropic nổi lên như đối thủ đáng gờm nhất của OpenAI.
(VNF) - iPhone 18 Pro Max và Google cùng Pixel 11 Pro XL - hai cái tên đình đám nhất thế giới di động chuẩn bị bước vào cuộc cạnh tranh trực diện năm 2026.
(VNF) - Cột mốc lịch sử đưa gã khổng lồ chip nhớ Micron bước ra khỏi cái bóng Nvidia, thiết lập một định nghĩa hoàn toàn mới cho nhóm siêu cổ phiếu công nghệ.
(VNF) - Doanh nghiệp công nghệ Việt Nam đang bước sang giai đoạn phát triển mới, từ cung cấp phần mềm đơn lẻ sang kiến tạo hạ tầng vận hành số cho nền kinh tế.
(VNF) - Đà Nẵng kêu gọi đầu tư vào loạt dự án công nghệ cao, trung tâm dữ liệu, bán dẫn và đổi mới sáng tạo với quy mô lớn, trong đó có dự án Trung tâm dữ liệu quy mô cấp vùng tại xã Thăng Bình với định hướng xây dựng trung tâm dữ liệu khu vực châu Á.
(VNF) - Các chuyên gia cho rằng AI không nên được nhìn như một cuộc đua công nghệ thuần túy. Câu hỏi cần đặt ra trước tiên là AI được dùng để giải quyết vấn đề gì, phục vụ ai và tạo ra giá trị xã hội cụ thể ra sao.
(VNF) - Cơn sốt AI đang tạo ra những “gã khổng lồ” mới trên thị trường công nghệ toàn cầu và cái tên mới nhất gây chấn động giới tài chính là SK Hynix.
(VNF) - Hàng loạt tài khoản Instagram của các shop online và local brand tại Việt Nam bất ngờ bị checkpoint (khóa tạm thời) chỉ sau khi nhận tin nhắn từ người lạ đang khiến cộng đồng kinh doanh online hoang mang.
(VNF) - Trong khi các đối thủ chi hàng trăm tỷ USD để xây dựng tương lai AI chưa rõ hình dạng, Apple lại chọn chiến lược thực dụng và ung dung hưởng lợi.
(VNF) - Không còn là 1 chatbot 'đãng trí' sau mỗi lần đóng cửa sổ, ChatGPT vừa được OpenAI cung cấp tính năng lưu trữ tài liệu vĩnh viễn. Người dùng miễn phí cũng được cấp dung lượng lưu trữ riêng.
(VNF) - Các nhà nghiên cứu Ả Rập Xê Út đã phát minh ra NESCOD, hệ thống làm mát không cần tới điện năng mà chạy bằng muối và ánh nắng, mở ra tương lai đầy hứa hẹn về các công nghệ làm mát thân thiện với môi trường.
(VNF) - SpaceX đang tiến những bước cuối cùng trước khi công bố bản cáo bạch IPO được mong đợi bậc nhất trong lịch sử ngành công nghệ và hàng không vũ trụ.
(VNF) - Trong khi nỗi lo về việc Trí tuệ nhân tạo (AI) “bóp nghẹt” ngành phần mềm đang đè nặng lên tâm lý giới đầu tư toàn cầu, quỹ ngoại NTAsset lại đưa ra một góc nhìn ngược lại: Đám đông có thể đang nhầm lẫn giữa việc “tạo ra phần mềm” và “triển khai công nghệ”.
(VNF) - Theo UBND TP.Huế, phương án thiết kế cầu qua Cồn Hến cần hướng đến tính độc bản, đặc sắc, có tầm vóc; trở thành điểm nhấn kiến trúc mới trên sông Hương, góp phần làm giàu thêm không gian văn hóa, cảnh quan của đô thị Huế.