DeepSeek – Khi Truyền Thông Vượt Xa Thực Tế

Share this post on:

Trí tuệ nhân tạo (AI) đang trở thành vũ khí chiến lược trong cuộc đua công nghệ toàn cầu, và Trung Quốc, với tham vọng cạnh tranh với phương Tây, đã đẩy mạnh phát triển các mô hình AI nội địa. DeepSeek, cái tên mới nhất trong danh sách này, đang được quảng bá như một đối thủ ngang tầm OpenAI. Nhưng liệu nó có thực sự xứng đáng với danh tiếng đó, hay chỉ là sản phẩm của một chiến dịch PR tinh vi?

Logo Deepseek AI

Điều đáng nói ở đây là cách DeepSeek sử dụng chính dữ liệu của mình để tạo ra một câu chuyện có lợi, trong khi thực tế lại không hoàn toàn giống như vậy. Các biểu đồ và số liệu mà họ đưa ra, nếu phân tích kỹ, sẽ bộc lộ nhiều điểm yếu mà PR không thể che giấu. Bài viết này sẽ phân tích từng khía cạnh, từ hiệu suất, giá cả đến tính ứng dụng thực tế, để làm sáng tỏ sự thật đằng sau DeepSeek.


Khả năng thực sự có ngang tầm OpenAI?

DeepSeek tuyên bố ngang bằng OpenAI-o1, nhưng khi phân tích bảng hiệu suất (hình thứ hai), có thể thấy rõ ràng rằng tuy nó đạt điểm cao trong một số bài kiểm tra, nhưng điều đó không có nghĩa là nó có thể thực sự cạnh tranh với GPT-4o hay Claude-3.5.

  • MATH-500 (bài kiểm tra toán học): DeepSeek-R1 đạt 94.3 – 94.5%, con số cao nhưng không có nghĩa nó mạnh toàn diện.
  • GPQA Diamond (bài kiểm tra suy luận phức tạp): DeepSeek-R1 đạt 62.1, thấp hơn Claude-3.5 (65.0) và OpenAI-o1-mini (60.0). Điều này cho thấy nó vẫn còn kém trong việc xử lý thông tin thực tế.
  • LiveCodeBench (bài kiểm tra lập trình thực tế): DeepSeek-R1 chỉ đạt 57.5, thấp hơn cả Claude-3.5 Sonnet (38.9) và GPT-4o (32.9).
Deepseek AI tương tác

Mặc dù DeepSeek có vẻ mạnh trên các bài kiểm tra toán học, nhưng hiệu suất trên các bài toán lập trình và suy luận cho thấy nó chưa thể sánh ngang với các đối thủ hàng đầu. Điều này chứng tỏ DeepSeek không thực sự “tinh thông” mà chỉ đơn giản là được tối ưu hóa cho một số bài kiểm tra nhất định.


Biểu đồ hiệu suất vs. giá – Một cách PR có chủ đích?

Trong hình ảnh cuối cùng, DeepSeek-V3 được đặt ở vị trí lý tưởng, với hiệu suất cao nhất và giá thấp nhất. Nhưng nếu nhìn kỹ cách sắp xếp dữ liệu, có thể thấy đây là một chiến thuật truyền thông khéo léo:

  1. Thang đo logarit làm giảm khoảng cách giá: Trục hoành (giá API) được hiển thị theo thang logarit, khiến sự khác biệt về giá giữa DeepSeek và các đối thủ trông nhỏ hơn thực tế. Nếu vẽ theo thang tuyến tính, mức giá của OpenAI sẽ cao hơn nhiều, còn DeepSeek sẽ bị đặt xa hơn về phía phải.
  2. Chỉ sử dụng MMLU làm thước đo: MMLU (Massive Multitask Language Understanding) là một chỉ số về kiến thức tổng quát, nhưng không phản ánh đầy đủ khả năng của AI. Những bài kiểm tra khác về toán học, lập trình và suy luận – vốn quan trọng hơn trong ứng dụng thực tế – lại bị bỏ qua.
  3. Vị trí của DeepSeek-V3 trong vùng “optimum range” là có chủ đích: Đây là cách sắp đặt hình ảnh phổ biến trong marketing, giúp người xem tin rằng DeepSeek là lựa chọn tốt nhất. Nếu thực sự mạnh, tại sao họ không để mô hình này cạnh tranh trực tiếp với GPT-4o trong các bài toán lập trình hoặc luận lý phức tạp?

Bằng cách này, DeepSeek đã khéo léo “dẫn dắt” người xem thay vì trình bày một bức tranh thực tế.


Giá rẻ có thực sự là lợi thế?

DeepSeek quảng bá chi phí sử dụng thấp:

  • 0.14 USD/triệu token đầu vào (cache hit)
  • 0.55 USD/triệu token đầu vào (cache miss)
  • 2.19 USD/triệu token đầu ra (trong khi OpenAI có thể lên tới 60 USD/triệu token)

Nhưng một AI rẻ không có nghĩa là một AI tốt. Điều quan trọng là:

  • Tốc độ phản hồi của DeepSeek chậm, khiến người dùng phải đợi lâu hơn để nhận được kết quả.
  • Khả năng hiểu câu hỏi kém, đôi khi dẫn đến việc người dùng phải thử lại nhiều lần, làm lãng phí token.
  • Độ chính xác thấp trong các bài toán phức tạp, khiến doanh nghiệp không thể tin tưởng nó cho các nhiệm vụ quan trọng.
DeepSeek-V3 tỷ lệ hiệu suất so với giá

Nếu một AI phản hồi sai hoặc mất nhiều thời gian xử lý, giá rẻ cũng trở nên vô nghĩa. Người dùng cuối cùng sẽ phải sử dụng nhiều token hơn để nhận được một câu trả lời có chất lượng tương đương với GPT-4o, làm chi phí thực tế cao hơn so với mức giá quảng cáo.


DeepSeek có thực sự mở?

DeepSeek tự hào về việc là một mô hình mã nguồn mở, khác biệt với các đối thủ phương Tây. Nhưng mã nguồn mở không đồng nghĩa với chất lượng vượt trội:

  • Mặc dù mã nguồn mở giúp cộng đồng nghiên cứu và tối ưu hóa mô hình, nhưng nếu thuật toán không thực sự mạnh, thì việc mở mã nguồn cũng không có giá trị.
  • OpenAI không công khai mô hình của mình vì họ có dữ liệu huấn luyện và hệ thống tối ưu hóa hiệu suất mạnh hơn. DeepSeek chưa chứng minh được rằng nó có thể đạt chất lượng tương tự chỉ bằng việc “mở” mô hình.
  • Nếu DeepSeek thực sự mạnh, tại sao những AI mã nguồn mở khác như Llama-3.1 hay Mistral vẫn chưa bị vượt qua?

Mã nguồn mở có thể là một chiến lược tốt, nhưng nó không thể thay thế hiệu suất thực tế.


DeepSeek vẫn chỉ là một sản phẩm PR?

DeepSeek đang sử dụng một chiến thuật truyền thông rất thông minh: họ tận dụng các biểu đồ được thiết kế có chủ đích để tạo ra hình ảnh về một mô hình AI “tối ưu nhất”. Nhưng khi kiểm tra kỹ:

  • Nó không thực sự mạnh trong các bài kiểm tra quan trọng như suy luận phức tạp hay lập trình.
  • Tốc độ chậm, độ chính xác chưa cao, điều này có thể khiến người dùng mất nhiều token hơn để có được câu trả lời chính xác.
  • Chiến lược giá rẻ có thể không mang lại lợi thế, nếu hiệu suất không tương xứng.
  • Biểu đồ được thiết kế để gây ấn tượng, chứ không phải phản ánh thực tế.
So sánh hiệu suất DeepSeek-V3 với các mô hình AI hàng đầu

DeepSeek có thể là một sản phẩm tiềm năng, nhưng hiện tại nó chưa thể thay thế OpenAI, Claude hay Gemini trong các ứng dụng thực tế. Nếu không có cải tiến đáng kể, nó sẽ chỉ là một hiện tượng nhất thời, được hỗ trợ bởi truyền thông, hơn là một đối thủ thực sự trong cuộc đua AI toàn cầu.


Khám phá thêm từ Đường Chân Trời

Đăng ký để nhận các bài đăng mới nhất được gửi đến email của bạn.

Author: Trương Minh Đăng

Trương Minh Đăng, một giáo viên Lịch sử tận tâm, hiện đang sống và làm việc tại thành phố Huế. Tôi có niềm đam mê sâu sắc với lịch sử và địa lý, hai lĩnh vực mà tôi có thể thảo luận hàng giờ mà không cảm thấy mệt mỏi. Ngoài giờ lên lớp, tôi còn dành thời gian nghiên cứu và chia sẻ kiến thức về hai lĩnh vực này trên các diễn đàn và mạng xã hội.

Là một người Công giáo, đức tin đã hình thành nên những giá trị cốt lõi trong cuộc sống của tôi, thôi thúc tôi không ngừng cống hiến cho việc giáo dục và xây dựng một xã hội tốt đẹp hơn. Tôi tin rằng, thông qua giáo dục, chúng ta có thể khơi dậy tiềm năng và truyền cảm hứng cho thế hệ trẻ, tạo nên những thay đổi tích cực cho cộng đồng và đất nước.

View all posts by Trương Minh Đăng >