Informações sobre o curso

100% online

Comece imediatamente e aprenda em seu próprio cronograma.

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.

Nível intermediário

Aprox. 25 horas para completar

Sugerido: 6 недель обучения, 6-8 часов в неделю...

Russo

Legendas: Russo

100% online

Comece imediatamente e aprenda em seu próprio cronograma.

Prazos flexíveis

Redefinir os prazos de acordo com sua programação.

Nível intermediário

Aprox. 25 horas para completar

Sugerido: 6 недель обучения, 6-8 часов в неделю...

Russo

Legendas: Russo

Programa - O que você aprenderá com este curso

Semana
1
5 horas para concluir

Введение, булев поиск

Этим занятием открывается цикл лекций, посвященных информационному поиску. Мы начнем с небольшого экскурса в историю возникновения вэб-поиска, изучим базовые понятия и узнаем, как можно классифицировать разные поисковые системы. Базовый вид поиска – это булев поиск. Мы рассмотрим, как он устроен и как можно исполнять запросы пользователей к такому поиску. Но недостаточно использовать оригинальный текст – чтобы учесть разные морфологические формы одного и того же слова, применяются различные этапы нормализации текста. Это применимо не только к документам, но и к запросам. Отдельно стоит рассмотреть такие важные усовершенствования булева поиска, как координатный поиск, которые учитывает, где именно в тексте находятся конкретные слова, и обработку полноценных фразовых запросов....
14 vídeos (total de (Total 70 mín.) min), 2 leituras, 5 testes
14 videos
МФТИ1min
История поисковых систем5min
Базовые понятия4min
Классификация поисковых систем4min
Основы булева поиска. Логические операции3min
Матрица инцидентности и переход к обратному индексу3min
Обработка запросов с обратным индексом4min
Зачем нужна нормализация18min
Определение языка3min
Стемминг2min
Лемматизация текста4min
Фразовые запросы4min
Координатный индекс3min
2 leituras
Mail.Ru Group5min
Решение10min
4 exercícios práticos
Базовые понятия информационного поиска8min
Булев поиск и матрица инцидентности14min
Нормализация текста. Стемминг. Лемматизация10min
Фразовые запросы. Координатный индекс6min
Semana
2
4 horas para concluir

Поисковый индекс

В основе текстового информационного поиска лежит концепция обратного индекса. Эта неделя посвящена разным методам его построения, расширения за счет дополнительной информации и улучшения работы с ним благодаря сжатию словаря и ускорению работы с обратным индексом....
9 vídeos (total de (Total 48 mín.) min), 1 leitura, 3 testes
9 videos
Построение индекса на реальной коллекции документов8min
Блочное индексирование. Распределенное индексирование6min
Инкрементальная индексация3min
Параметрические индексы и зонные индексы2min
Сокращение индекса, стоп-слова5min
Сжатие словаря6min
Сжатие инвертированного файла7min
Skip-листы2min
1 leituras
Решение10min
2 exercícios práticos
Обратный индекс, индексация10min
Сжатие индекса12min
Semana
3
5 horas para concluir

Нечёткий поиск

Эта неделя посвящена двум большим темам, связанным между собой: исправление опечаток в запросах пользователей и выполнение неточных запросов, в которых пользователь сознательно скрывает часть слова за специальным знаком – "*"....
9 vídeos (total de (Total 54 mín.) min), 1 leitura, 4 testes
9 videos
Структуры для словарей. Деревья8min
Нечёткий поиск5min
Перестановочный индекс3min
K-граммный индекс5min
Расстояние редактирования10min
Динамический алгоритм нахождения расстояние между словами3min
Фонетические исправления3min
Исправления в контексте4min
1 leituras
Решение10min
3 exercícios práticos
Структуры данных8min
Нечеткий поиск8min
Исправление ошибок14min
Semana
4
4 horas para concluir

Ранжирование

Выполнение запросов пользователей на большом корпусе документов часто приводит к тому, что запросу удовлетворяет слишком много документов. Для того, чтобы пользователю не пришлось просматривать все найденные документы, поисковая система может отобрать из них только лучшие и показать пользователю в порядке "полезности". Этим занимается ранжирование, о котором и пойдет речь в этой неделе....
8 vídeos (total de (Total 41 mín.) min), 1 leitura, 3 testes
8 videos
Текстовое ранжирование5min
Модель мешка слов6min
Представление документов в виде векторов. Расстояние между документами3min
Tf-Idf4min
Принцип вероятностного ранжирования3min
Бинарная модель независимости6min
Переход от BIM к BM258min
1 leituras
Решение10min
2 exercícios práticos
Текстовое ранжирование10min
Вероятностная модель ранжирования14min

Sobre Instituto de Física e Tecnologia de Moscou

Московский физико-технический институт (неофициально известный как МФТИ или Физтех) является одним из самых престижных в мире учебных и научно-исследовательских институтов. Он готовит высококвалифицированных специалистов в области теоретической и прикладной физики, прикладной математики, информатики, биотехнологии и смежных дисциплин. Физтех был основан в 1951 году Нобелевской премии лауреатами Петром Капицей, Николаем Семеновым, Львом Ландау и Сергеем Христиановичем. Основой образования в МФТИ является уникальная «система Физтеха»: кропотливое воспитание и отбор самых талантливых абитуриентов, фундаментальное образование высшего класса и раннее вовлечение студентов в реальную научно-исследовательскую работу. Среди выпускников МФТИ есть Нобелевские лауреаты, основатели всемирно известных компаний, известные космонавты, изобретатели, инженеры....

Sobre Mail.Ru Group

Mail.Ru Group, международный бренд My.com – крупнейший холдинг в России по дневной мобильной аудитории. В рамках стратегии communitainment Mail.Ru Group развивает единую интегрированную платформу коммуникационных и развлекательных интернет-сервисов. Компании принадлежат лидирующий почтовый сервис, один из крупнейших порталов в рунете, крупнейшие русскоязычные социальные сети – ВКонтакте, Одноклассники и Мой Мир, а также два популярных в России и СНГ мессенджера – Агент Mail.Ru и ICQ....

Perguntas Frequentes – FAQ

  • Ao se inscrever para um Certificado, você terá acesso a todos os vídeos, testes e tarefas de programação (se aplicável). Tarefas avaliadas pelos colegas apenas podem ser enviadas e avaliadas após o início da sessão. Caso escolha explorar o curso sem adquiri-lo, talvez você não consiga acessar certas tarefas.

  • Quando você adquire o Certificado, ganha acesso a todo o material do curso, incluindo avaliações com nota atribuída. Após concluir o curso, seu Certificado eletrônico será adicionado à sua página de Participações e você poderá imprimi-lo ou adicioná-lo ao seu perfil no LinkedIn. Se quiser apenas ler e assistir o conteúdo do curso, você poderá frequentá-lo como ouvinte sem custo.

Mais dúvidas? Visite o Central de Ajuda ao Aprendiz.