Подписка на новостиСамара TECH в твиттере!Самара TECH в FacebookСамара TECH в ЖЖ

Обзоры

Самарский стартап «Право.ru»

pravo-logoСамарские разработчики написали агрегатор, который обращается к правовым документам, выложенным в свободный доступ и аккумулирует их в едином информационном пространстве. Проблема состоит в том, что далеко не все документы выкладываются государственными органами. Более того, все документы выкладываются в разных форматах (pdf, txt, doc и так далее). Не соблюдается никакой типографики - у документов нет единой формы подачи.

Для нормализации документов разработчиками компании «Право.ru» была реализована система многоступенчатой обработки и очистки документов, которая позволила добиться приемлемого качества. При разработке СПС «Право.ru» упор был сделан на пользовательский интерфейс и на схему обновления. СПС «Право.ru» (docs.pravo.ru) находится в интернете и обновляется ежедневно. Соответственно, пользователь может работать с документами из любой точки и в любое время. Достаточно подключения к интернету. Что касается удобства работы − разработчики предусмотрели все необходимые сервисы. Пользователь может сохранить документ в Избранное и в дальнейшем он будет под рукой. Также есть возможность делать заметки и оставлять комментарии к частям документа. Комментарии будут видны всем пользователям, что обычно приводит к оживленной дискуссии.

Отдельного внимания заслуживают связанные документы и сравнения редакций. Связанные документы − документы, которые упоминаются в просматриваемом нормативном акте − доступны по клику на соответствующую иконку. Их список отобразится в правом окне, причем доступна сортировка по категории документа. Пользователь может сравнить редакции, выбрав необходимые даты. Изменения, внесенные более поздней из выбранных ревизий, будут выделены. Просмотр происходит в режиме сплит-экрана.

Более того, любой документ можно просматривать в режиме сплит-экрана. Это дает возможность смотреть части документа, на которые идет ссылка в просматриваемой части документа. Документы разбиты на смысловые логически законченные блоки - сущности, которые выстроены в иерархию: глава, раздел, статья, пункт.

Поисковая выдача. Поиск осуществляется в пределах сущности, а не всего документа. В итоге результат поиска более точен для пользователя. Почти каждый документ имеет версии (ревизии). Поиск осуществляется только в актуальной ревизии − той версии документа, которая действительна на момент поиска. В то же время пользователь может самостоятельно открыть любую другую ревизию и искать в ней. Так как система находится в сети, разработчики могут использовать действия социума. Другими словами, если пользователи при одинаковом запросе выбирают пятый документ из результата поиска, то в следующий раз этот результат будет стоять первым в списке − происходит изменение веса документа.

Также работает «перевод» с языка пользователя на язык юридический. То есть в нормативном документе вы никогда не найдете «автомобиль» или «лизинг». Вместо этого будет «транспортное средство» и «финансовая аренда». Поисковая выдача успевает обработать запрос пользователя и выдать искомые документы, которые можно отсортировать по дате, релевантности и по органу.

Индексация. Сущность делится на label и body. В будущем это позволит пользователям искать по конкретной сущности, например, запрос ст. 295 НК РФ будет выдавать именно статью, а не весь документ (конечно, с возможностью перехода к полному тексту).

В правовой системе работает обратная связь, пользователь может обратиться с пожеланием о работе системы или просьбой найти конкретный документ. Отдел по работе с письмами пользователей обещает ответить в течении часа. На данный момент в системе более 3500000 документов. Ежедневно поступает около 1000 новых документов. СПС «Право.ru» уже имеет более 70000 пользователей.

Над проектом ежедневно трудится более 50 человек, не считая удаленных операторов, которые контролируют обработку документов.

Расскажи своим: