Microsoft bị tố sử dụng dữ liệu trái phép để huấn luyện AI

Gã khổng lồ phần mềm đã âm thầm sử dụng dữ liệu của người khác mà không thông báo.

Theo Neowin, giám đốc điều hành Steve Huffman của Reddit mới đây đã lên tiếng cáo buộc Microsoft đã sử dụng dữ liệu của họ để huấn luyện dịch vụ AI mà không được sự cho phép.

Theo ông Huffman, không chỉ Microsoft mà cả Anthropic và Perplexity cũng đã lấy dữ liệu từ Reddit để phục vụ cho việc phát triển AI của họ. Ông cho rằng các công ty này coi nội dung trên internet là miễn phí và có thể sử dụng tùy ý.

Microsoft bị tố sử dụng dữ liệu trái phép để huấn luyện AI - 1

Microsoft bị tố sử dụng trái phép dữ liệu của Reddit để huấn luyện AI.

Huffman khẳng định việc chặn các công ty này truy cập dữ liệu của Reddit là một "nỗi đau thực sự". Tuy nhiên, ông cũng nhận thấy quan điểm về việc các công cụ tìm kiếm sử dụng nội dung từ các trang web mà không có sự bồi thường đang dần thay đổi.

Trước đó, Reddit đã quyết định chặn quyền truy cập dữ liệu của mình từ các công cụ tìm kiếm, bao gồm cả Bing của Microsoft, trừ khi họ trả phí. Microsoft đã phản bác rằng họ đã cung cấp cho Reddit các công cụ để kiểm soát việc thu thập dữ liệu, nhưng Reddit vẫn quyết định chặn Bing.

Vụ việc này một lần nữa làm dấy lên những tranh cãi về việc sử dụng dữ liệu để huấn luyện AI. Các công ty công nghệ lớn đang bị chỉ trích vì khai thác dữ liệu từ các trang web khác mà không có sự đồng ý hoặc bồi thường thỏa đáng.

Thanh Phong

Tin liên quan

Tin mới nhất

Bình chọn 15 sự kiện Văn học nghệ thuật tiêu biểu năm 2025

Bình chọn 15 sự kiện Văn học nghệ thuật tiêu biểu năm 2025

Nhằm đánh giá những kết quả nổi bật của văn học nghệ thuật trong một năm vừa qua, ngày 29/12, tại Hà Nội, Liên hiệp các Hội Văn học nghệ thuật Việt Nam chỉ đạo, Thời báo Văn học nghệ thuật phối hợp Quỹ Hỗ trợ sáng tạo Văn học nghệ thuật Việt Nam tổ chức Lễ Bình chọn 15 sự kiện Văn học nghệ thuật tiêu biểu năm 2025. Đây là hoạt động thường niên có ý nghĩa quan trọng, gó