Интернет станет еще хуже после того, как Онлайн-Архивы потеряют доступ к Reddit

Начиная с этого момента, Wayback Machine, управляемый Internet Archive, больше не может сохранять конкретные страницы на Reddit. Reddit ограничил доступ, поскольку другие компании использовали архивы для обучения систем искусственного интеллекта. Однако некоторые ставят под сомнение логику Reddit, поскольку она противоречит его прошлым действиям. Для многих интернет-пользователей это изменение ощущается как препятствие для сохранения истории интернета (согласно The Verge).

🧐

Думаешь, 'медвежий рынок' — это что-то про Baldur's Gate 3? Тебе сюда. Объясним, почему Уоррен Баффет не покупает щиткоины.

Диверсифицировать портфель

Reddit не позволит архивировать подреддиты

До сих пор мы обнаружили огромное количество данных на Wayback Machine, начиная от отдельных тем Reddit и комментариев и заканчивая профилями пользователей. Это дало нам представление о древнем прошлом одного из самых оживлённых сайтов социальных сетей. Однако, как подтвердил представитель Reddit Тим Ратшмидт, это скоро изменится.

Интернет-архив предоставляет услуги, приносящие пользу общедоступному интернету, однако нам стало известно, что определенные фирмы, занимающиеся искусственным интеллектом, игнорируют правила платформы, в том числе наши, добывая данные из Wayback Machine.

В данный момент вносятся изменения, и в конечном итоге бот Wayback Machine получит доступ только к основной странице Reddit. Следовательно, он будет архивировать данные исключительно по топовым постам за каждый конкретный день и время.

По словам администраторов сайта, эти меры реализуются в первую очередь для защиты пользователей платформы. Однако вызывает вопросы, действительно ли Reddit ставит благополучие пользователей во главу угла, учитывая, что компании, работающие с искусственным интеллектом, могут использовать данные с сайта для обучения своих моделей. Интересно, что если кто-то платит за это (например, Google и OpenAI), то у властей сайта, похоже, не возникает никаких проблем с передачей этой информации.

Необходимо сохранять интернет

Интернет-архив, будучи некоммерческой организацией, не располагает финансовыми средствами, чтобы ежегодно тратить около 60 миллионов долларов, в отличие от Google, на бота, который мог бы снова записывать отдельные обсуждения или сабреддиты на платформах, таких как Reddit. Хотя это может показаться несущественным, многие пользователи тоскуют по прошлому и ценят возможность Wayback Machine заглянуть в историю.

Исследование Wayback Machine позволяет заглянуть в первые дни интернета, эпоху, когда онлайн-форумы царили безраздельно, а бот-сгенерированный спам в комментариях был редким явлением, благодаря быстрым блокировкам.

Учитывая текущую тенденцию, важно рассматривать эту ситуацию, поскольку Интернет и, возможно, игры становятся менее доступными. Согласно данным исследовательского центра Pew Research Center, примерно одна из трех веб-страниц, к которым у нас был доступ в 2013 году, больше не существует. Исследователи также отметили, что около половины статей в Википедии содержат ссылки на несуществующие страницы, в то время как почти четверть обычных веб-сайтов имеют неработающие гиперссылки.

Вполне возможно, что Wayback Machine заархивировал конкретный веб-сайт, обеспечивая доступность источника информации. Хотя Интернет-архив, как некоммерческая организация, не может сохранить каждый сайт, контент, который он сохраняет, свободно доступен всем.

Смотрите также

2025-08-12 16:14