Pengguna Bluesky Debat Paket seputar data pengguna dan pelatihan AI

Jejaring Sosial Bluesky baru -baru ini menerbitkan proposal di Github yang menguraikan opsi baru yang dapat memberi pengguna untuk menunjukkan apakah mereka ingin posting dan data mereka dikikis untuk hal -hal seperti pelatihan AI generatif dan pengarsipan umum.

CEO Jay Graber membahas proposal awal pekan ini, sementara di atas panggung di South by Southwest, tetapi menarik perhatian baru pada Jumat malam, setelah dia mempostingnya di Bluesky. Beberapa pengguna bereaksi dengan alarm terhadap rencana perusahaan, yang mereka lihat sebagai pembalikan desakan Bluesky sebelumnya bahwa itu tidak akan menjual data pengguna kepada pengiklan dan tidak akan melatih AI pada posting pengguna.

“Oh, neraka tidak!” Sketchette pengguna menulis. “Keindahan platform ini adalah tidak berbagi informasi. Terutama Gen AI. Jangan kau gua sekarang. ”

Graber menjawab bahwa perusahaan AI generatif “sudah menggosok data publik dari seluruh web,” termasuk dari Bluesky, karena “Segala sesuatu di Bluesky adalah publik seperti situs web adalah publik.” Jadi dia mengatakan Bluesky sedang mencoba membuat “standar baru” untuk mengatur goresan itu, mirip dengan file robots.txt yang digunakan situs web untuk mengomunikasikan izin mereka kepada perayap web.

Debat tentang pelatihan AI dan hak cipta telah menyeret robot.txt menjadi sorotan, antara lain menyoroti fakta bahwa itu tidak dapat ditegakkan secara hukum. Bluesky membingkai standar yang diusulkan sebagai yang akan memiliki “mekanisme dan harapan” yang serupa, memberikan “format yang dapat dibaca mesin, yang diharapkan oleh para aktor yang baik, dan memang membawa bobot etis, tetapi tidak dapat ditegakkan secara hukum.”

Di bawah proposal, pengguna aplikasi Bluesky, atau aplikasi lain yang menggunakan atprotocol yang mendasarinya, dapat masuk ke pengaturan mereka dan memungkinkan atau melarang penggunaan data bluesky mereka di empat kategori: AI generatif, protokol menjembatani (yaitu, menghubungkan ekosistem sosial yang berbeda), dataset besar -besaran, dan arsip web.

Jika pengguna menunjukkan bahwa mereka tidak ingin data mereka digunakan untuk melatih AI generatif, proposal mengatakan, “Perusahaan dan tim peneliti yang membangun set pelatihan AI diharapkan untuk menghormati niat ini ketika mereka melihatnya, baik ketika mengikis situs web, atau melakukan transfer curah menggunakan protokol itu sendiri.”

Molly White, yang menulis kutipan yang dibutuhkan Newsletter dan Web3 akan menjadi blog yang bagus, menggambarkan ini sebagai “proposal yang bagus,” dan mengatakan “aneh melihat orang -orang membakar bluesky untuk itu,” karena tidak begitu banyak “menyambut dalam goresan AI” tetapi lebih “mencoba menambahkan sinyal persetujuan untuk memungkinkan pengguna untuk mengomunikasikan preferensi yang telah terjadi.

“Saya pikir kelemahan dengan ini dan [Creative Commons’] Proposal serupa untuk 'sinyal preferensi' adalah bahwa mereka mengandalkan pencakar untuk menghormati sinyal -sinyal ini dari beberapa keinginan untuk menjadi aktor yang baik, ”lanjut White. “Kami telah melihat beberapa perusahaan ini meledak melewati robot.txt atau materi bajak laut untuk mengikis.”