Microsoft bị tố sử dụng dữ liệu trái phép để huấn luyện AI

Gã khổng lồ phần mềm đã âm thầm sử dụng dữ liệu của người khác mà không thông báo.

Theo Neowin, giám đốc điều hành Steve Huffman của Reddit mới đây đã lên tiếng cáo buộc Microsoft đã sử dụng dữ liệu của họ để huấn luyện dịch vụ AI mà không được sự cho phép.

Theo ông Huffman, không chỉ Microsoft mà cả Anthropic và Perplexity cũng đã lấy dữ liệu từ Reddit để phục vụ cho việc phát triển AI của họ. Ông cho rằng các công ty này coi nội dung trên internet là miễn phí và có thể sử dụng tùy ý.

Microsoft bị tố sử dụng dữ liệu trái phép để huấn luyện AI - 1

Microsoft bị tố sử dụng trái phép dữ liệu của Reddit để huấn luyện AI.

Huffman khẳng định việc chặn các công ty này truy cập dữ liệu của Reddit là một "nỗi đau thực sự". Tuy nhiên, ông cũng nhận thấy quan điểm về việc các công cụ tìm kiếm sử dụng nội dung từ các trang web mà không có sự bồi thường đang dần thay đổi.

Trước đó, Reddit đã quyết định chặn quyền truy cập dữ liệu của mình từ các công cụ tìm kiếm, bao gồm cả Bing của Microsoft, trừ khi họ trả phí. Microsoft đã phản bác rằng họ đã cung cấp cho Reddit các công cụ để kiểm soát việc thu thập dữ liệu, nhưng Reddit vẫn quyết định chặn Bing.

Vụ việc này một lần nữa làm dấy lên những tranh cãi về việc sử dụng dữ liệu để huấn luyện AI. Các công ty công nghệ lớn đang bị chỉ trích vì khai thác dữ liệu từ các trang web khác mà không có sự đồng ý hoặc bồi thường thỏa đáng.

Thanh Phong

Tin liên quan

Tin mới nhất

Ma trong “Linh hồn ký ức”

Ma trong “Linh hồn ký ức”

Cầm tập truyện ngắn “Linh hồn ký ức” vừa ấn hành năm 2025 của Phạm Công Thắng, ngay lập tức tôi nổi máu tò mò khi tác giả bảo rằng đây là “tập truyện ngắn ma mị - tâm linh”. Tôi đọc ngay trang 191, trang cuối cùng - trang mục lục. Các tiêu đề của 20 truyện ngắn đã thực sự cuốn hút tôi: “Ảo mộng Tân Đảo”, “Bí mật ngôi biệt thự ma”, “Bản án địa ngục”, “Bóng ma trong

Mở “túi khôn” xưa, đọc tính cách người Việt

Mở “túi khôn” xưa, đọc tính cách người Việt

Nếu có đủ sự hiểu biết, thời gian đầm mình trong sách vở cũng như trong thực tế đời sống, và cả sự dũng cảm đương đầu với cái khó, có lẽ người viết sẽ phải tính đến chuyện cho ra đời một công trình nghiên cứu nhằm trả lời câu hỏi: tính cách/ nhân cách văn hóa thực sự của người Việt là gì? Tuy nhiên trong khuôn khổ của một bài báo, thì đó là điều muôn lần bất khả. Vì