ГОЛОСА КИТАЯ: Открытые правительственные данные и платформы кредитных услуг

Источник изображения: BigStock/MicroOne

(автор заметки — Джордан Шнайдер)

Верящие в «огромный разрыв по технологиям AI между Китаем и Западом» любят расхваливать преимущества Китая в данных, особенно что касается «системы социального кредита». Обычно говорят, что государство, не связанное нормами конфиденциальности, собирает данные, которые позволят самой густонаселенной стране мира обучать AI на самых больших в мире массивах данных. Пекин неоднократно клялся сделать данные о социальном доверии доступными для общественности.

Но сколько из этих данных на самом деле добирается до пользователей? Оказывается, не очень много — говорит академическая статья из журнала Library and Information Science, сильно сокращённый перевод которой предлагается читателям. На основе обзора доступности данных в различных местных органах власти исследователь приходит к выводу, что предоставление данных неоднородно и плохо стандартизировано.

Как и многие другие аспекты «системы социального кредита», рассматриваемые данные могут находиться дальше, чем они кажутся.

Анализ открытых правительственных данных и платформ кредитных услуг в Китае

Автор: Сяо Дию

Первоначальная публикация: Тушу Цинбао Баодаокан (图书情报导刊) 2019, выпуск 7

Источник: Yuandian Credit https://mp.weixin.qq.com/s/xugzyprTafQYRaoP8Ve9bQ

Наброски: ускорение открытия государственных данных — это важнейшая задача на всех уровнях государственного управления в Китае и горячая тема на передовой электронного управления и управления информацией.

Правительство — это основной держатель социальных данных, поэтому государственные данные — это неотъемлемая часть так называемых «больших данных».

Правительство владеет более чем 90% информационных всех социальных ресурсов, и из различных типов официальных данных, раскрытие кредитной информации постоянно привлекает наибольшее внимание общественности.

Правительственная кредитная информация обычно определяется как та, что генерируется и регистрируется административными учреждениями, например, информация об административных лицензиях, штрафах и поощрениях.

Открытие: в последние годы различные местные органы власти в Китае активно изучают многочисленные способы открытия государственной кредитной информации. Один из наиболее популярных методов — предоставление информации через раздел кредитных услуг на государственной платформе открытых данных.

Предоставление данных: основными поставщиками информации являются департаменты коммерции, контроля качества, налогообложения и управления жилищным фондом в различных регионах, причем данные дифференцируются и классифицируются по критериям или конкретным характеристикам.

В документе отмечается, что некоторые системы классифицируют данные по темам — например, инспекция, промышленность, строительство — в то время как другие классифицируют их по государственным учреждениям и отраслям промышленности.

Частота обновления данных

Важный критерий оценки своевременности данных — периодичность и постоянство их обновления. Проведя статистический анализ частоты обновления кредитной информации на платформах различных провинций и городов, исследование показало, что:

  • 7 платформ предоставили сведения о частоте обновления кредитной информации, Пекин не ответил.
  • Цзинань и Гуанчжоу имеют достаточно много массивов данных, частота обновления которых неизвестна.
  • На семи платформах данных 68.2% данных — статические (в том числе обновляемые ежегодно, по требованию, нерегулярно и неизвестно когда), а 31.8% данных — динамические (включая ежеквартальные, ежемесячные, еженедельные, ежедневные и обновляющиеся в реальном времени).

Права на использование: права на использование — это важный критерий оценки открытости данных платформы. Она в основном включает следующие 3 аспекта: «свобода данных», право на свободное использование, а также свободное распространение и обмен данными.

Что касается «свободных данных», при сравнении соглашений об открытом лицензировании данных в различных регионах, в Пекине, Цзинане, Гуанчжоу и Шэньчжэне в соглашении указано, что на данный момент все пользователи имеют право на свободный доступ ко всем государственным информационным ресурсам, предоставляемым веб-сайтом. В провинциях Цзянси и Чэнду говорится, что пользователи, успешно зарегистрировавшиеся через платформу, имеют право на бесплатный доступ и использование информационных ресурсов. В провинции Гуйчжоу в соглашении устанавливается, что «все услуги по передаче данных, предоставляемые правительством на платформе, являются бесплатными».

В Шанхае более подробно объясняется, что подразумевается под «свободными данными». Это означает, что пользователи, которые успешно зарегистрировались и прошли верификацию, могут получить имеющиеся открытые данные бесплатно и имеют право на свободный доступ к ним, согласно приложению.

Во-вторых, что касается права на свободное использование данных, в Пекине, Шанхае, Гуйчжоу, Гуанчжоу и Чэнду в соглашении о платформе чётко гарантируется право пользователя на свободное использование данных. В Пекине, Цзинань, Гуанчжоу, Шэньчжэнь и Чэнду требуется, чтобы пользователи указывали источник данных в своих результатах исследований, своевременно размещали на веб-сайте информацию о любом использовании данных, а также активно сотрудничали с соответствующими опросами пользователей и исследованиями исходных данных. В Шанхае и провинции Гуйчжоу от пользователей требуется чётко указывать источник данных и дату загрузки из с платформы в результатах исследования.

Только в провинции Цзянси не даётся никаких пояснений по свободному распространению и обмену данными. В городах Цзинань и Шэньчжэнь пользователям необходимо бесплатно передавать различные исходные данные, полученные на платформе. Шанхай не позволяет пользователям передавать данные за плату. Во всех соглашениях чётко указывается, что пользователи должны соблюдать соответствующие государственные законы при распространении и обмене полученными данными.

Проблемы

Поскольку социальная кредитная система Китая совершенствуется, также важно повышать открытость государственной кредитной информации. Недостатки всё ещё существуют, главным образом, в следующих аспектах:

  1. Объём предоставляемой кредитной информации, как правило, невелик. В Шэньчжэне больше всего массивов данных в стране — 39, в то время как в провинции Цзянси меньше всего — шесть.
  2. Качество и количество кредитной информации на платформах, как правило, неидеально. Судя по представленной информации, текущие источники данных в основном сосредоточены в департаментах промышленности и торговли, инспекции качества, а также налогообложения и управления жилищным фондом, в то время как другие государственные ведомства значительно отстают. Многие правительственные ведомства публикуют мало или вообще не публикуют никакие массивы данных на платформе.
  3. Данные кредитной информации не стандартизированы.
  4. Некоторые положения ограничивают законное использование данных. Такая ситуация явно противоречит основным принципам государственных открытых данных.
  5. Общее количество посещений и загрузок кредитной информации невелико.
  6. Качество самих платформ низкое. Визуализация данных оставляет желать лучшего. Только некоторые массивы данных на некоторых платформах можно предварительно просматривать и проводить статистический анализ. Кроме того, они неудобны в использовании.