Microsoft bị tố sử dụng dữ liệu trái phép để huấn luyện AI

Gã khổng lồ phần mềm đã âm thầm sử dụng dữ liệu của người khác mà không thông báo.

Theo Neowin, giám đốc điều hành Steve Huffman của Reddit mới đây đã lên tiếng cáo buộc Microsoft đã sử dụng dữ liệu của họ để huấn luyện dịch vụ AI mà không được sự cho phép.

Theo ông Huffman, không chỉ Microsoft mà cả Anthropic và Perplexity cũng đã lấy dữ liệu từ Reddit để phục vụ cho việc phát triển AI của họ. Ông cho rằng các công ty này coi nội dung trên internet là miễn phí và có thể sử dụng tùy ý.

Microsoft bị tố sử dụng dữ liệu trái phép để huấn luyện AI - 1

Microsoft bị tố sử dụng trái phép dữ liệu của Reddit để huấn luyện AI.

Huffman khẳng định việc chặn các công ty này truy cập dữ liệu của Reddit là một "nỗi đau thực sự". Tuy nhiên, ông cũng nhận thấy quan điểm về việc các công cụ tìm kiếm sử dụng nội dung từ các trang web mà không có sự bồi thường đang dần thay đổi.

Trước đó, Reddit đã quyết định chặn quyền truy cập dữ liệu của mình từ các công cụ tìm kiếm, bao gồm cả Bing của Microsoft, trừ khi họ trả phí. Microsoft đã phản bác rằng họ đã cung cấp cho Reddit các công cụ để kiểm soát việc thu thập dữ liệu, nhưng Reddit vẫn quyết định chặn Bing.

Vụ việc này một lần nữa làm dấy lên những tranh cãi về việc sử dụng dữ liệu để huấn luyện AI. Các công ty công nghệ lớn đang bị chỉ trích vì khai thác dữ liệu từ các trang web khác mà không có sự đồng ý hoặc bồi thường thỏa đáng.

Thanh Phong

Tin liên quan

Tin mới nhất

Đôi nét về bút ký đương đại khu vực Đồng bằng sông Cửu Long

Đôi nét về bút ký đương đại khu vực Đồng bằng sông Cửu Long

Từ đầu thế kỷ XXI đến nay, thể loại bút ký ngày càng phát triển, tạo được một vị thế nhất định trong hệ sinh quyển văn chương nước ta. Đề tài phản ánh của bút ký đương đại rất phong phú, từ công cuộc đấu tranh dựng nước, giữ nước, hình tượng người lính và chiến tranh cách mạng, đến những nhân vật, đề tài mang tính thế sự, những vùng đất, những con người mang dấu ấ