Microsoft bị tố sử dụng dữ liệu trái phép để huấn luyện AI

Gã khổng lồ phần mềm đã âm thầm sử dụng dữ liệu của người khác mà không thông báo.

Theo Neowin, giám đốc điều hành Steve Huffman của Reddit mới đây đã lên tiếng cáo buộc Microsoft đã sử dụng dữ liệu của họ để huấn luyện dịch vụ AI mà không được sự cho phép.

Theo ông Huffman, không chỉ Microsoft mà cả Anthropic và Perplexity cũng đã lấy dữ liệu từ Reddit để phục vụ cho việc phát triển AI của họ. Ông cho rằng các công ty này coi nội dung trên internet là miễn phí và có thể sử dụng tùy ý.

Microsoft bị tố sử dụng dữ liệu trái phép để huấn luyện AI - 1

Microsoft bị tố sử dụng trái phép dữ liệu của Reddit để huấn luyện AI.

Huffman khẳng định việc chặn các công ty này truy cập dữ liệu của Reddit là một "nỗi đau thực sự". Tuy nhiên, ông cũng nhận thấy quan điểm về việc các công cụ tìm kiếm sử dụng nội dung từ các trang web mà không có sự bồi thường đang dần thay đổi.

Trước đó, Reddit đã quyết định chặn quyền truy cập dữ liệu của mình từ các công cụ tìm kiếm, bao gồm cả Bing của Microsoft, trừ khi họ trả phí. Microsoft đã phản bác rằng họ đã cung cấp cho Reddit các công cụ để kiểm soát việc thu thập dữ liệu, nhưng Reddit vẫn quyết định chặn Bing.

Vụ việc này một lần nữa làm dấy lên những tranh cãi về việc sử dụng dữ liệu để huấn luyện AI. Các công ty công nghệ lớn đang bị chỉ trích vì khai thác dữ liệu từ các trang web khác mà không có sự đồng ý hoặc bồi thường thỏa đáng.

Thanh Phong

Tin liên quan

Tin mới nhất

Lắng âm vọng nhân sinh trong nhạc Trịnh

Lắng âm vọng nhân sinh trong nhạc Trịnh

Trong chuyên luận “Trịnh Công Sơn - ngôn ngữ và những ám ảnh nghệ thuật” (NXB Văn hóa Sài Gòn, 2008), nhà phê bình Bùi Vĩnh Phúc đã xác quyết: “Trịnh Công Sơn là một nhạc sĩ, điều đó đã hẳn. Nhưng, trên và trước hết, người nhạc sĩ đó lại chính là một thi sĩ tự trong bản chất và trong cách thế sai sử ngôn ngữ của mình”. Diễn đạt theo cách khác, nhận định trên đã chạm tới một

Đua xe F1, phân hạng Sprint: GR63 trở lại vị trí pole, Mercedes độc chiếm hàng xuất phát đầu tiên

Đua xe F1, phân hạng Sprint: GR63 trở lại vị trí pole, Mercedes độc chiếm hàng xuất phát đầu tiên

(Tin thể thao, tin đua xe F1) Sau chuỗi chặng liên tiếp không có thành tích khả quan, George Russell đã xuất sắc trở lại P1 tại vòng phân hạng Sprint của chặng Canadian GP, giúp Mercedes độc chiếm hàng xuất phát đầu tiên cùng người đồng đội Kimi Antonelli. Trong khi đó, McLaren, Ferrari và Red Bull lần lượt chiếm trọn các hàng xuất phát kế tiếp.