Казахстанская компания Alem Research, основанная в 2007 году в Алматы, была одним из первых резидентов Парка Информационных Технологий (ПИТ). В последние годы она занимается разработками в области мониторинга и анализа средств массовой информации. Сергазы Нарынов, генеральный директор Alem Research, в интервью Digital.Report рассказывает, почему заинтересованность к этому направлению проявляет не только бизнес, но и государственный сектор.

Сергазы Нарынов, генеральный директор Alem Research
Digital.Report: Чем занимается ваша компания?
Сергазы Нарынов: Мы изначально занимались проектами автоматизации информационной среды корпоративного сектора, но четыре года назад решили перейти на SaaS. Это глобальный тренд, который подразумевает представление программного обеспечения как услуги (Software as a Service). Этот подход, в том числе, позволяет клиенту пользоваться софтом удаленно, не создавая у себя собственную ИКТ-инфраструктуру, не закупать сервера и не нанимать специалистов – это становится слишком дорого и неэффективно. Если раньше дистанционно пользовались только хранилищем данных, то сейчас сам софт тоже находится на стороне подрядчика. Вам не надо его покупать, устанавливать себе на компьютер.
Расскажите подробнее об автоматизации информационной среды корпоративного сектора.
Внутренние CRM-системы (Customer relationship management – управление взаимодействием с потребителем), анализ данных, сбор отчетности – все это можно автоматизировать и получать не «сырые» данные в Excel, а уже с проверкой их валидности. Например, государственный фонд поддержки предпринимательства «Даму» («Развитие») получал информацию в таблицах о своих бенефициарах – их кредитах, производительности и так далее – со всей республики. Все данные приходят в разных форматах, где-то по ошибке появляется дополнительная строка или столбик. Чтобы исключить подобные ситуации, мы реализовали функционал, позволяющий вводить данные в специализированном виде, чтобы на выходе получать обобщенную, переработанную информацию.
Получается, своего рода шаблон?
Это data flow, поток данных – то, как он должен идти, во что преобразовываться. Мы убрали промежуточные звенья – людей, которые выполняли всю эту работу. Это, во-первых, удешевляет для клиентов бизнес, а во-вторых, уменьшает вероятность ошибки в данных, ведь их проверка идет на этапе ввода. Но сейчас мы перешли на технологии SaaS и не продаем софт, а сдаем его в аренду без установки на компьютере заказчика. Клиент просто имеет к нему доступ через веб-интерфейс и платит абонентскую плату.
И этот софт занимается мониторингом медиа?
Да. Мы используем систему web-crawling, чтобы собрать данные с тысяч источников, после чего обрабатываем их с применением систем искусственного интеллекта и выдаем заказчику рафинированную информацию по тем темам и задачам, которые интересуют его, например, по обсуждению определенной темы или по фактическим упоминаниям конкретного имени или наименования. Далее идет анализ эмоциональной тональности при помощи нейронных сетей с точностью около 80%. Это достаточно высокий коэффициент обработки неструктурированной информации.
Важно корректно подобрать источники данных, например исключить материалы рекламного характера, и сделать работу оперативно – в течение 5-10 минут после выхода статьи заказчик должен уже знать, что про него говорили в СМИ и в социальных сетях. После сбора информации по желанию клиента может быть произведено формирование статистических отчетов, например, по динамике упоминаемости поквартально, помесячно или ежедневно, насколько меняется эмоциональное отношение при упоминании и так далее. Чтобы собирать такую статистику, надо, чтобы упоминаемость клиента была большой, поэтому этот сервис чаще заказывают компании, которые хорошо представлены в средствах массовой информации, в том числе в социальных сетях.
Наши заказчики – это акиматы (местные исполнительные органы власти), крупные организации, банки. И им нужно видеть, как часто про них пишут, сколько, в каком тоне и где. Информация может предоставляться в сводном виде, подборкой, в графиках. Анализируются источники на казахском и русском языках.
А английский?
Английский язык у нас поддерживается, но мы ориентированы на локальных клиентов. Это наше преимущество на данный момент, и наш охват по казахстанскому сектору очень хороший. На сегодня более 30 клиентов используют наше решение – примерно пополам государственные и частные. Заказчики заинтересованы в данном продукте, а для Казахстана это пока единственная информационная система. В России таких систем порядка десяти, и они тоже пытаются зайти на казахстанский рынок и работать по данному направлению.
Насколько соотносится ваша система с правом человека на неприкосновенность частной жизни?
Соцсети мониторятся исключительно по постам, которые находятся в полном открытом доступе. У нас нет технологии, позволяющей просматривать личную переписку или закрытые посты, хотя в мире есть компании, предлагающие и такие услуги. У нас все официально. Если говорить концептуально, благодаря этой технологии у заказчика появляется обратная связь с обществом и новый инструмент стратегического планирования. Какая проблематика больше всего интересует клиентов или граждан? На что надо уделить больше внимания? Очень важно сравнить эти проблемы с количеством упоминаний, степенью резонансности. Это необходимо для того, чтобы правильно использовать ресурсы, заниматься наиболее серьезными вещами. Навскидку достаточно сложно сказать, какая из проблем важнее. Блогеры и любые активные граждане, когда говорят о каких-то проблемах, рассчитывают на то, что они будут услышаны.
Насколько софт, который вы разработали, может помочь в оценке эффективности государственного управления?
По меньшей мере, он может оценить общий настрой, количество негативных отзывов по определенным направлениям, персоналиям, организациям и так далее, уже в динамике можно получить анализ тенденций.
Как госструктуры реагируют на эту статистику? Есть ли политическая воля что-то изменить, или все эти системы внедряются просто для «галочки»?
Думаю, есть. Во-первых, они получают инструмент, который позволяет им распознать проблему. Увидев ее, они могут выполнить свою основную миссию – решить проблему. Во-вторых, это вопрос репутации. Мы здесь на стороне клиентов, то есть госорганизаций или корпоративных клиентов. Мы пытаемся им быстрее показать потенциальные риски, на которые они должны сами реагировать. Наша система показывает им – где вас критикуют, за что и кто.
То есть, система выдаст поименно тех, кто критикует и заказчик увидит это?
Чаще всего – да.
По вашим наблюдениям, после того как вы указываете на проблему, насколько часто и быстро она решается госструктурами?
Этой статистики мы не ведем. Уверен, все зависит от человеческого фактора конкретно на местах. Можно решать проблему, а можно кому-то закрывать рот судебными исками.
Сотрудничаете ли вы с правоохранительным органами, которые тоже занимаются мониторингом соцсетей на предмет выявления различных критичных высказываний?
И да, и нет. Мы не работаем со структурами национальной безопасности и карательной системой, но имели опыт работы со структурами, занимающимися проверкой достоверности информации. Видите ли, передо мной тоже стояла дилемма, когда мы начинали этот проект, – насколько это этично и правильно. Я сделал для себя вывод, что это инструмент абсолютной прозрачности. Если человек пишет для всех то, что он думает о том, что происходит, то его должны услышать – в том числе, и наши заказчики. Мы с помощью информационной системы даем властям или, скажем, банкам, максимальную информированность и оперативность, что позволит им быть лучше.
В начале проекта стояла дилемма – насколько этично и правильно сотрудничать со структурами, занимающимися проверкой достоверности информации. Я для себя сделал вывод, что наше решение – инструмент абсолютной прозрачности.
Может ли ваша система мониторинга быть использована во вред правам пользователей? Например, кто-то написал что-то, и на него в суд подал чиновник.
Если человек в открытую написал что-то, и чиновник с помощью нашей системы или как-то иначе это увидел – он вправе подать в суд, если не согласен с тем, что там написано. Автор поста ответственен за то, что он пишет. Каждый имеет право воспользоваться правовыми средствами защиты своих интересов. На месте чиновника может оказаться автор поста и наоборот. Если он хотел написать что-то так, чтобы этого никто не увидел или не увидел этот чиновник, то он может писать в режиме «только друзьям».
И ваша система этого не увидит?
Она не сможет. Она видит, только если он сказал всем, взяв ответственность за сказанное. Мы не прокуроры. Это просто система сбора информации, которая собирает данные и делает это во благо общества. Другое дело, как технология, задуманная для одной цели, может быть использована для решения других задач. Это уже вопрос этики для того человека, который принимает решения на основе полученной информации.
Расскажите о вашем проекте с Агентством по статистике Казахстана.
Это был проект электронной статистики, в нем участвовали информационно-вычислительные центры агентства, а также мы 4 года наряду с другими ИТ-компаниями. Множество организаций и учреждений отчитываются перед статистическим ведомством, но раньше это было слабо автоматизированно, требовало очень много ручной работы по сбору и обработке, анализу данных. В Казахстане около 7000 человек занималось этой работой. Проект позволил сократить существенную часть трудозатрат. Наша задача состояла в автоматизации части этого процесса. Это проект «Талдау» – визуализация и возможность выгрузки сводной информации. Сервис сейчас работает, система позволяет обслуживать десятки тысяч человек одновременно.
Насколько известно, там была проблема с методологией – год от года она менялась, что затрудняло анализ, сопоставление данных…
Да. Меняются методики и источники, что не позволяет в сводной информации сравнивать период с периодом. Если раньше использовали один способ вычисления, то теперь уже другой… Эта проблема, насколько мне известно, осталась. Более того, она существует не только в данном государственном органе. Это очень серьезный вопрос, и если они не будут последовательно придерживаться определенных методов сбора, конечно, будут возникать неточности.
Айгерим Толеуханова, Адиль Нурмаков
- Like
- Digg
- Del
- Tumblr
- VKontakte
- Buffer
- Love This
- Odnoklassniki
- Meneame
- Blogger
- Amazon
- Yahoo Mail
- Gmail
- AOL
- Newsvine
- HackerNews
- Evernote
- MySpace
- Mail.ru
- Viadeo
- Line
- Comments
- Yummly
- SMS
- Viber
- Telegram
- Subscribe
- Skype
- Facebook Messenger
- Kakao
- LiveJournal
- Yammer
- Edgar
- Fintel
- Mix
- Instapaper
- Copy Link