Microsoft bị tố sử dụng dữ liệu trái phép để huấn luyện AI

Gã khổng lồ phần mềm đã âm thầm sử dụng dữ liệu của người khác mà không thông báo.

Theo Neowin, giám đốc điều hành Steve Huffman của Reddit mới đây đã lên tiếng cáo buộc Microsoft đã sử dụng dữ liệu của họ để huấn luyện dịch vụ AI mà không được sự cho phép.

Theo ông Huffman, không chỉ Microsoft mà cả Anthropic và Perplexity cũng đã lấy dữ liệu từ Reddit để phục vụ cho việc phát triển AI của họ. Ông cho rằng các công ty này coi nội dung trên internet là miễn phí và có thể sử dụng tùy ý.

Microsoft bị tố sử dụng dữ liệu trái phép để huấn luyện AI - 1

Microsoft bị tố sử dụng trái phép dữ liệu của Reddit để huấn luyện AI.

Huffman khẳng định việc chặn các công ty này truy cập dữ liệu của Reddit là một "nỗi đau thực sự". Tuy nhiên, ông cũng nhận thấy quan điểm về việc các công cụ tìm kiếm sử dụng nội dung từ các trang web mà không có sự bồi thường đang dần thay đổi.

Trước đó, Reddit đã quyết định chặn quyền truy cập dữ liệu của mình từ các công cụ tìm kiếm, bao gồm cả Bing của Microsoft, trừ khi họ trả phí. Microsoft đã phản bác rằng họ đã cung cấp cho Reddit các công cụ để kiểm soát việc thu thập dữ liệu, nhưng Reddit vẫn quyết định chặn Bing.

Vụ việc này một lần nữa làm dấy lên những tranh cãi về việc sử dụng dữ liệu để huấn luyện AI. Các công ty công nghệ lớn đang bị chỉ trích vì khai thác dữ liệu từ các trang web khác mà không có sự đồng ý hoặc bồi thường thỏa đáng.

Thanh Phong

Tin liên quan

Tin mới nhất

“Những người đàn bà đi qua chiến tranh” sức mạnh phi thường và cao đẹp

“Những người đàn bà đi qua chiến tranh” sức mạnh phi thường và cao đẹp

Nhà văn Nguyễn Thị Vân Anh (sinh năm 1947, tại Đống Đa, Hà Nội) là một cây bút giàu sức sáng tạo. Ngoài sự nghiệp báo chí đã thành danh, từ khi vào Hội Nhà văn Hà Nội năm 1970, Hội Nhà văn Việt Nam năm 1986, chị đã đi chặng đường lao động văn chương 56 năm, với hơn hai chục đầu sách: truyện ngắn, truyện vừa, tiểu thuyết, kịch bản...