«Трансперенси» ищет программистов

«Трансперенси Интернешнл - Россия» нужны программисты для участия в образовательной программе Tech4integrity, которую мы проводим совместно с американской некоммерческой инициативой Sunlight Foundation. Задачи будут включать работу с наборами данных, сбор данных, парсинг сайтов и анализ информации. Данные, которые мы вам предоставим, собраны участниками программы, которые работают над выявлениями случаев трансграничной коррупции.

Требования

  • Знание языка Python на высоком уровне. Знание иных языков, в том числе C#, будет плюсом;

  • Уверенное владение английским не ниже Upper Intermediate.


Условия

  • Удаленная работа;

  • Гибкий график с апреля по май 2020 года (10-30 часов в неделю);

  • Работа по договору.


Успешно прошедших собеседование кандидатов мы попросим раскрыть информацию о своих контрагентах и работодателях. 

Тестовое задание

В вашем распоряжении находятся два списка с именами персон:

  • Перечень российских публичных должностных лиц, в котором они поименованы с использованием кириллицы. В списке указаны полностью фамилия, имя и отчество лица, либо инициалы (буква или буква с точкой). Возможно, имя представлено целиком, а отчество — аббревиатурой.

  • Перечень клиентов регистратора оффшорных компаний в юрисдикции Кипра. Список приведен в латинице, для разных случаев использованы разные способы транслитерации. В отдельных случаях упоминаются отчества в полном или сокращенном виде, в других — нет; в некоторых случаях используются полные формы имен, где-то инициалы; имена могут стоять перед фамилией или наоборот.


Без подготовки конкретного кода предложите схему работы с описанными наборами, которая позволит конечному пользователю сопоставить наличие людей из первого списка со вторым. Опишите ключевые инструменты и методы, которые вы планируете использовать. Опишите также возможные ошибки и проблемы, которые могут возникнуть при работе по описанной вами схеме — как зависящие от самой схемы, так и зависящие от данных. Опишите метрики оценки качества работы схемы и качества входящих данных.

Предлагаемое решение направьте на адрес jvirblis@transparency.org.ru до 27 марта включительно. Укажите желаемую часовую ставку. Вы можете сопроводить его своим  резюме и/или ссылкой на ваш репозиторий.