Informações sobre o curso
2,296 visualizações recentes

100% online

Comece imediatamente e aprenda em seu próprio cronograma.

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.

Nível intermediário

Russo

Legendas: Russo

100% online

Comece imediatamente e aprenda em seu próprio cronograma.

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.

Nível intermediário

Russo

Legendas: Russo

Programa - O que você aprenderá com este curso

Semana
1
5 horas para concluir

Введение, булев поиск

Этим занятием открывается цикл лекций, посвященных информационному поиску. Мы начнем с небольшого экскурса в историю возникновения вэб-поиска, изучим базовые понятия и узнаем, как можно классифицировать разные поисковые системы. Базовый вид поиска – это булев поиск. Мы рассмотрим, как он устроен и как можно исполнять запросы пользователей к такому поиску. Но недостаточно использовать оригинальный текст – чтобы учесть разные морфологические формы одного и того же слова, применяются различные этапы нормализации текста. Это применимо не только к документам, но и к запросам. Отдельно стоит рассмотреть такие важные усовершенствования булева поиска, как координатный поиск, которые учитывает, где именно в тексте находятся конкретные слова, и обработку полноценных фразовых запросов.

...
14 vídeos ((Total 70 mín.)), 2 leituras, 5 testes
14 videos
МФТИ1min
История поисковых систем5min
Базовые понятия4min
Классификация поисковых систем4min
Основы булева поиска. Логические операции3min
Матрица инцидентности и переход к обратному индексу3min
Обработка запросов с обратным индексом4min
Зачем нужна нормализация18min
Определение языка3min
Стемминг2min
Лемматизация текста4min
Фразовые запросы4min
Координатный индекс3min
2 leituras
Mail.Ru Group5min
Решение10min
4 exercícios práticos
Базовые понятия информационного поиска8min
Булев поиск и матрица инцидентности14min
Нормализация текста. Стемминг. Лемматизация10min
Фразовые запросы. Координатный индекс6min
Semana
2
4 horas para concluir

Поисковый индекс

В основе текстового информационного поиска лежит концепция обратного индекса. Эта неделя посвящена разным методам его построения, расширения за счет дополнительной информации и улучшения работы с ним благодаря сжатию словаря и ускорению работы с обратным индексом.

...
9 vídeos ((Total 48 mín.)), 1 leitura, 3 testes
9 videos
Построение индекса на реальной коллекции документов8min
Блочное индексирование. Распределенное индексирование6min
Инкрементальная индексация3min
Параметрические индексы и зонные индексы2min
Сокращение индекса, стоп-слова5min
Сжатие словаря6min
Сжатие инвертированного файла7min
Skip-листы2min
1 leituras
Решение10min
2 exercícios práticos
Обратный индекс, индексация10min
Сжатие индекса12min
Semana
3
5 horas para concluir

Нечёткий поиск

Эта неделя посвящена двум большим темам, связанным между собой: исправление опечаток в запросах пользователей и выполнение неточных запросов, в которых пользователь сознательно скрывает часть слова за специальным знаком – "*".

...
9 vídeos ((Total 54 mín.)), 1 leitura, 4 testes
9 videos
Структуры для словарей. Деревья8min
Нечёткий поиск5min
Перестановочный индекс3min
K-граммный индекс5min
Расстояние редактирования10min
Динамический алгоритм нахождения расстояние между словами3min
Фонетические исправления3min
Исправления в контексте4min
1 leituras
Решение10min
3 exercícios práticos
Структуры данных8min
Нечеткий поиск8min
Исправление ошибок14min
Semana
4
4 horas para concluir

Ранжирование

Выполнение запросов пользователей на большом корпусе документов часто приводит к тому, что запросу удовлетворяет слишком много документов. Для того, чтобы пользователю не пришлось просматривать все найденные документы, поисковая система может отобрать из них только лучшие и показать пользователю в порядке "полезности". Этим занимается ранжирование, о котором и пойдет речь в этой неделе.

...
8 vídeos ((Total 41 mín.)), 1 leitura, 3 testes
8 videos
Текстовое ранжирование5min
Модель мешка слов6min
Представление документов в виде векторов. Расстояние между документами3min
Tf-Idf4min
Принцип вероятностного ранжирования3min
Бинарная модель независимости6min
Переход от BIM к BM258min
1 leituras
Решение10min
2 exercícios práticos
Текстовое ранжирование10min
Вероятностная модель ранжирования14min

Sobre Instituto de Física e Tecnologia de Moscou

Московский физико-технический институт (Физтех) является одним из ведущих вузов страны и входит в основные рейтинги лучших университетов мира. Институт обладает не только богатой историей – основателями и профессорами института были Нобелевские лауреаты Пётр Капица, Лев Ландау и Николай Семенов – но и большой научно-исследовательской базой. Основой образования в МФТИ является уникальная «система Физтеха», сформулированная Петром Капицей: кропотливый отбор одаренных и склонных к творческой работе абитуриентов; участие в обучении ведущих научных работников; индивидуальный подход к отдельным студентам с целью развития их творческих задатков; воспитание с первых шагов в атмосфере технических исследований и конструктивного творчества с использованием потенциала лучших лабораторий страны. Среди выпускников МФТИ — нобелевские лауреаты Андрей Гейм и Константин Новоселов, основатель компании ABBYY Давид Ян, один из авторов архитектурных принципов построения вычислительных комплексов Борис Бабаян и др....

Sobre Mail.Ru Group

Mail.Ru Group, международный бренд My.com – крупнейший холдинг в России по дневной мобильной аудитории. В рамках стратегии communitainment Mail.Ru Group развивает единую интегрированную платформу коммуникационных и развлекательных интернет-сервисов. Компании принадлежат лидирующий почтовый сервис, один из крупнейших порталов в рунете, крупнейшие русскоязычные социальные сети – ВКонтакте, Одноклассники и Мой Мир, а также два популярных в России и СНГ мессенджера – Агент Mail.Ru и ICQ....

Perguntas Frequentes – FAQ

  • Ao se inscrever para um Certificado, você terá acesso a todos os vídeos, testes e tarefas de programação (se aplicável). Tarefas avaliadas pelos colegas apenas podem ser enviadas e avaliadas após o início da sessão. Caso escolha explorar o curso sem adquiri-lo, talvez você não consiga acessar certas tarefas.

  • Quando você adquire o Certificado, ganha acesso a todo o material do curso, incluindo avaliações com nota atribuída. Após concluir o curso, seu Certificado eletrônico será adicionado à sua página de Participações e você poderá imprimi-lo ou adicioná-lo ao seu perfil no LinkedIn. Se quiser apenas ler e assistir o conteúdo do curso, você poderá frequentá-lo como ouvinte sem custo.

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.