Курс “Цифровые методы в гуманитарных науках”
Часть 2, апрель-июнь 2020
Важно: Очные встречи происходят в нашей команде в MS Teams, регулярная коммуникация — в телеграм-чатике
Цифровое сохранение культурного наследия. XML как способ хранения данных в привязке к тексту; стандарт TEI
Дата: 11 апреля
Видео про TEI/XML (А. Бонч-Осмоловская, Д.Скоринкин):
XML и TEI: способы работы с ними (практика)
Дата: 18 апреля
Проект 1: микро-издание в TEI/XML
Дата: 25 апреля
Компьютерный анализ тематики текста: ключевые слова, тематическое моделирование
Введение:
Тетрадка: ключевые слова в Python
Тематическое моделирование:
Примеры из DH:
Как делать ТМ в Mallet:
Геоинформационные системы (GIS) и Digital Humanities
- Тут будут материалы и презентации
Проект 2: GIS для DH
Конец второй части — июнь 2020
Часть 1, январь-март 2020 (до коронавируса)
Введение
Дата: 11 января Вводная презентация
Культуромика и Cultural Analytics: исследования культуры в эпоху Big Data
Дата: 18 января
Доклады:
- Lev Manovich. The Science of Culture? Social Computing, Digital Humanities and Cultural Analytics. — Мария Долгодворова.
- Ted Underwood. How not to do things with words. — Михаил Сонькин.
К парам можно почитать:
- Michel J.-B. et al. Quantitative Analysis of Culture Using Millions of Digitized Books // Science. 2011. Vol. 331, № 6014. P. 176–182.
- Gooding P. (2012). Mass digitization and the garbage dump: The conflicting needs of quantitative and qualitative methods. Literary and Linguistic Computing, 28(3), 425–431
- Tim Hitchcock (2011) Culturomics, Big Data, Code Breakers and the Casaubon Delusion
- Pechenick E. A., Danforth C. M., Dodds P. S. (2015). Characterizing the Google Books corpus: Strong limits to inferences of socio-cultural and linguistic evolution
- Michael Pettit (2016) Historical time in the age of big data: Cultural psychology, historical change, and the Google Books Ngram Viewer
Задание на семинаре:
Делается в Google Ngram Viewer
- Сравните частотности слов science и religion в англоязычных текстах
- А теперь наука и церковь — в русскоязычных
- Разберитесь, как построить график, который показывал бы разницу между частотностью упоминания Ленина и Сталина (т.е. чтобы линия была одна; выше нуля, когда Ленина больше, ниже — когда больше Сталина)
- Постройте один график с четырьмя линиями, которые отражали бы частотность слов color и colour в двух корпусах — британского и американского английского
- Постройте график, который бы отражал отношение частотности словосочетания в Украине к сумме частотности словосочетаний в Украине и на Украине
- Постройте график частотности слов телефон,телевизор,компьютер,пейджер,телеграф но частотность пейджера пусть будет умножена на 20
Distant Reading (“Дальнее чтение”) и корпусные методы в филологии
Дата: 25 января
Доклады на лекции:
- Franco Moretti. Conjectures on World Literature — Ирина Дмитриевская.
- оригинал
- русский перевод (не распространяйте файлы, пожайлуйста).
Доклады на семинарах:
- Ted Underwood. Seven ways humanists are using computers to understand text. — Татьяна Казакова в 12:10 и Кирилл Ко́нча в 13:40.
- Ryan Heuser, Long Le-Khac. A Quantitative Literary History of 2,958 Nineteenth-Century British Novels: The Semantic Cohort Method — Анна Смирнова + Мария Долгодворова в 12:10 и Злата Шкутько + Григорий Кузнецов в 13:40.
Количественные методы определения авторства и стилометрия: почему это работает и к чему можно применить (лекция, начало практики в stylo)
Дата: 1 февраля
-
К паре можно почитать: Holmes D., Kardos J. Who Was the Author? An Introduction to Stylometry — хороший вводный текст о стилометрии, на удивление точный и актуальный, несмотря на то, что ему уже немало лет.
-
Доклад на лекции: Maciej Eder. Style-Markers in Authorship Attribution A Cross-Language Study of the Authorial Fingerprint — Катя Тарасова
Стилометрия: больше практики в stylo, продвинутые возможности, техническая консультация
Дата: 8 февраля
Вторая часть презентации по стилометрии
Ваши презентации групповых исследований №1
Дата: 15 февраля
Сетевой анализ (лекция, начало практики в Gephi)
Дата: 22 февраля
Сетевой анализ: продолжение практики в Gephi, продвинутые возможности, щепотка программирования (для желающих)
Дата: 29 февраля
Вторая презентация “Сетевой анализ”
Коворкинг и техническая консультация
Дата: 14 марта
Ваши презентации групповых исследований №2
Дата: 21 марта