CÔNG NGHỆ

Trợ lý AI DeepSeek “gây sốc” cộng đồng công nghệ thế giới

Cập nhật ngày: 29/01/2025 09:00:39

Những ngày gần đây, sự xuất hiện của DeepSeek đã “gây sốc” với cộng đồng công nghệ AI của thế giới… vì chi phí phát triển cực thấp. DeepSeek được biết đến là một công ty AI của Trung Quốc, được thành lập vào năm 2023 bởi Liang Wenfeng và có trụ sở tại Hàng Châu, tỉnh Chiết Giang.

DeepSeek "hấp dẫn" vì chi phí huấn luyện AI thấp hơn nhiều so với các mô hình khác

Vào ngày 10/1, DeepSeek ra mắt chatbot miễn phí đầu tiên, DeepSeek-R1 và nhanh chóng vượt qua ChatGPT, trở thành ứng dụng miễn phí được tải xuống nhiều nhất trên App Store của iOS tại Mỹ vào ngày 27/1. Trong đó, không ít người Việt nam đã tải ứng dụng này và trên kho ứng dụng, nhiều người dùng từ Việt Nam có lời khen ngợi DeepSeek, so sánh với sản phẩm từ OpenAI, Google.

Sự xuất hiện của DeepSeek đã dẫn đến việc giá cổ phiếu của Nvidia giảm 18%, gây ra sự xáo trộn đáng kể trong ngành công nghệ. Tuy nhiên, trong thông báo cuối ngày 27/1, DeepSeek cho biết, sẽ tạm thời hạn chế đăng ký người dùng mới do một cuộc tấn công mạng. Cho đến trưa 28/1, DeepSeek vươn lên vị trí số một trong bảng xếp hạng ứng dụng miễn phí được tải về nhiều nhất trên kho ứng dụng App Store và nằm trong top 5 ở hạng mục Hiệu suất trên CH Play.

DeepSeek đã “gây sốc” với cộng đồng công nghệ AI của thế giới vì chi phí phát triển cực thấp và hơn nữa nó là mã nguồn mở, mở ra nhiều cơ hội lớn cho các cá nhân, tổ chức, thậm chí quốc gia khác muốn tham gia phát triển DeepSeek.

Trước đây, để huấn luyện các chatbot, những mô hình AI thành công nhất đòi hỏi một lượng lớn sức mạnh tính toán. Các công ty như ChatGPT (do Sam Altman sáng lập) và Meta phải sử dụng tới 16.000 chip Nvidia - loại chip nổi tiếng với hiệu suất năng lượng cao và khả năng xử lý tác vụ phức tạp, có giá từ 30.000 đến 40.000 USD mỗi chiếc.

Tuy nhiên, DeepSeek khẳng định rằng, họ chỉ cần khoảng 2.000 chip Nvidia kém tiên tiến hơn để huấn luyện mô hình AI cơ bản của mình với chi phí khoảng 6 triệu USD, hoàn thành trong chưa đầy 2 tháng. Theo Citigroup, Microsoft, Meta, Amazon và Alphabet đã chi tổng cộng khoảng 209 tỷ USD vào cơ sở hạ tầng dữ liệu trong năm ngoái, trong đó 80% dành cho trung tâm dữ liệu.

DeepSeek với DeepSeek-R1, mô hình "lập luận" của công ty, có khả năng giải quyết những vấn đề toán học và khoa học phức tạp ngay cả trong các lĩnh vực chưa từng được tiếp cận. Mô hình này được đánh giá có thể thực hiện nhiệm vụ tương đương với mô hình o1 của OpenAI, nhưng với chi phí thấp hơn từ 20 đến 50 lần cho khách hàng doanh nghiệp.

Theo BÁ TÂN (SGGP)

< Trở về trang trước