Love AI
New member
Microsoft vừa công bố ba mô hình AI nội bộ: MAI-Transcribe-1, MAI-Voice-1 và MAI-Image-2. Các mô hình đã có trên Microsoft Foundry và MAI Playground, nhằm mở rộng lựa chọn cho nhà phát triển bên cạnh OpenAI và Google.
Microsoft đã chính thức phát hành ba mô hình AI nội bộ: MAI-Transcribe-1, MAI-Voice-1 và MAI-Image-2. Chúng có thể truy cập qua Microsoft Foundry và MAI Playground, mở ra lựa chọn mới cho nhà phát triển bên cạnh các dịch vụ của OpenAI và Google.
MAI-Transcribe-1 là mô hình chuyển giọng nói thành văn bản hỗ trợ 25 ngôn ngữ. Microsoft cho biết nó nhanh hơn khoảng 2,5 lần so với dịch vụ Azure Fast trước đây và được phát triển bởi một nhóm nhỏ gồm 10 người.
MAI-Voice-1 tập trung vào tổng hợp giọng nói tự nhiên: model có thể tạo 60 giây âm thanh nghe rất tự nhiên chỉ trong khoảng 1 giây xử lý, đồng thời hỗ trợ thiết lập giọng đọc tùy chỉnh chỉ từ một đoạn âm thanh ngắn.
MAI-Image-2 là mô hình tạo ảnh khả năng cao nhất hiện tại của Microsoft và đã lọt vào top 3 trên bảng xếp hạng Arena.ai. Microsoft bắt đầu triển khai năng lực hình ảnh này vào các sản phẩm như Bing và PowerPoint.
Về mặt pháp lý, đến tháng 10/2025 Microsoft mới hết ràng buộc từ thỏa thuận ký năm 2019 với OpenAI, thỏa thuận vốn cấp cho Microsoft giấy phép dùng mô hình của OpenAI nhưng đồng thời hạn chế Microsoft phát triển một số mô hình 'frontier' riêng. Khi hạn chế này chấm dứt, Microsoft đã công bố các mô hình MAI vốn đã âm thầm hỗ trợ Copilot và Teams.
Mustafa Suleyman, CEO mảng AI của Microsoft, nhấn mạnh công ty vẫn cam kết hợp tác với OpenAI dù song song đẩy mạnh chiến lược phát triển mô hình riêng. Microsoft cũng công bố mức giá cho ba mô hình này thấp hơn so với các sản phẩm tương đương từ Amazon và Google, điều có thể khiến MAI trở thành nền tảng hạ tầng AI cho nhiều sản phẩm Microsoft nếu hiệu năng thực tế đáp ứng kỳ vọng.
Các mô hình hiện đã sẵn sàng cho nhà phát triển trên nền tảng Foundry, mở ra cơ hội tích hợp nhanh vào ứng dụng và dịch vụ mới của bên thứ ba và Microsoft.
Nguồn: Digitaltrends
Microsoft đã chính thức phát hành ba mô hình AI nội bộ: MAI-Transcribe-1, MAI-Voice-1 và MAI-Image-2. Chúng có thể truy cập qua Microsoft Foundry và MAI Playground, mở ra lựa chọn mới cho nhà phát triển bên cạnh các dịch vụ của OpenAI và Google.
MAI-Transcribe-1 là mô hình chuyển giọng nói thành văn bản hỗ trợ 25 ngôn ngữ. Microsoft cho biết nó nhanh hơn khoảng 2,5 lần so với dịch vụ Azure Fast trước đây và được phát triển bởi một nhóm nhỏ gồm 10 người.
MAI-Voice-1 tập trung vào tổng hợp giọng nói tự nhiên: model có thể tạo 60 giây âm thanh nghe rất tự nhiên chỉ trong khoảng 1 giây xử lý, đồng thời hỗ trợ thiết lập giọng đọc tùy chỉnh chỉ từ một đoạn âm thanh ngắn.
MAI-Image-2 là mô hình tạo ảnh khả năng cao nhất hiện tại của Microsoft và đã lọt vào top 3 trên bảng xếp hạng Arena.ai. Microsoft bắt đầu triển khai năng lực hình ảnh này vào các sản phẩm như Bing và PowerPoint.
Về mặt pháp lý, đến tháng 10/2025 Microsoft mới hết ràng buộc từ thỏa thuận ký năm 2019 với OpenAI, thỏa thuận vốn cấp cho Microsoft giấy phép dùng mô hình của OpenAI nhưng đồng thời hạn chế Microsoft phát triển một số mô hình 'frontier' riêng. Khi hạn chế này chấm dứt, Microsoft đã công bố các mô hình MAI vốn đã âm thầm hỗ trợ Copilot và Teams.
Mustafa Suleyman, CEO mảng AI của Microsoft, nhấn mạnh công ty vẫn cam kết hợp tác với OpenAI dù song song đẩy mạnh chiến lược phát triển mô hình riêng. Microsoft cũng công bố mức giá cho ba mô hình này thấp hơn so với các sản phẩm tương đương từ Amazon và Google, điều có thể khiến MAI trở thành nền tảng hạ tầng AI cho nhiều sản phẩm Microsoft nếu hiệu năng thực tế đáp ứng kỳ vọng.
Các mô hình hiện đã sẵn sàng cho nhà phát triển trên nền tảng Foundry, mở ra cơ hội tích hợp nhanh vào ứng dụng và dịch vụ mới của bên thứ ba và Microsoft.
Nguồn: Digitaltrends
Bài viết liên quan