Размер:
AAA
Цвет: CCC
Изображения Вкл.Выкл.
Обычная версия сайта

Ученый ГАГУ разработал уникальную ИТ-платформу «DH-EuroTravel» для анализа европейских книг о Сибири

Ученый ГАГУ разработал уникальную ИТ-платформу «DH-EuroTravel» для анализа европейских книг о Сибири

В Горно-Алтайском государственном университете под руководством доктора филологических наук, профессора П.В. Алексеева успешно продолжаются исследования в рамках регионального гранта Российского научного фонда при поддержке Правительства Республики Алтай. Ключевым результатом первого этапа стала разработка авторской исследовательской ИТ-платформы «DH-EuroTravel», которая открывает новые возможности для междисциплинарного анализа путевой прозы.

В Республике Алтай подобное междисциплинарное ИТ-исследование на стыке компьютерных методов и филологии осуществляется впервые. Созданный руководителем проекта П.В. Алексеевым программный комплекс на базе специализированных скриптов на языке Python позволил соединить классические методы филологического анализа с передовыми инструментами компьютерной гуманитаристики и цифрового текстового анализа (Digital Humanities). Следуя принципам открытой науки, автор опубликовал исходный код платформы, конфигурационные лексиконы и архитектуру пайплайна для международного академического сообщества. Программа размещена в открытом доступе на крупнейшем ИТ-портале GitHub по адресу: https://github.com/pavelaleks/winterschool. Это обеспечивает полную прозрачность расчетов и позволяет исследователям из любой точки мира верифицировать результаты анализа или запускать софт на собственных массивах данных.

Формирование репрезентативной источниковедческой базы стало одним из наиболее трудоемких этапов работы исследовательского коллектива ГАГУ. В фокус внимания проекта вошел масштабный массив путевой прозы, включающий более 200 оригинальных текстов травелогов, изданных на английском, французском и немецком языках в период конца XIX – начала XX века. Данный корпус охватывает широчайший спектр жанровых модификаций эго-документов: от официальных отчетов научных и дипломатических экспедиций до светских путевых заметок коммерсантов, охотничьих дневников и специфических образцов западноевропейской женской путевой прозы, включая английскую викторианскую и французскую традиции конца XIX века.

Подобный полиязыковой и кросс-культурный охват необходим для того, чтобы преодолеть рамки изучения отдельного национального взгляда и реконструировать целостную, наднациональную макроструктуру западноевропейского имперского дискурса. Традиционный филологический анализ вручную столь масштабного и лингвистически разнородного текстового массива потребовал бы десятилетий рутинной работы. Именно этот колоссальный объем источников продиктовал необходимость технологического прорыва — перевода гуманитарных категорий на язык цифр с помощью методов цифровых гуманитарных наук. Разработанная платформа способна эффективно переводить сотни тысяч страниц путевых нарративов на язык проверяемых математических индексов и структурированных семантических матриц.

Как работает «DH-EuroTravel»?

Разработанная платформа реализует сквозной интеллектуальный пайплайн:

1. Цифровая реставрация. Скрипты автоматически очищают оцифрованные исторические тексты от технического шума и ошибок сканирования.

2. Преодоление этнонимических ловушек. Европейские авторы прошлого часто путали народы, например, упорно называли казахов киргизами, а алтайцев-тюрок – калмыками. База данных платформы автоматически распознает и объединяет эти ложные номинации по леммам слов, собирая точный контекст.

3. PIRO-разметка: программа анализирует каждое упоминание сибирских народов по оригинальной четырехмерной методике: она автоматически вычленяет связанные с ними описания и эпитеты, находит жесткие речевые стереотипы обобщения, определяет общую тональность образа — от романтизации до негатива и фиксирует конкретный исход или результат межнационального контакта. Такой подход позволяет автоматически переводить живую речь путешественников в точные аналитические таблицы.

4. Математические фильтры. С помощью статистического критерия логарифмического правдоподобия программа оценивает значимость флуктуаций частот слов в контекстных окнах этнонимов, автоматически отсекая общеязыковой фон и извлекая из текста маркерные лексемы авторских стереотипов.

Программный комплекс уже доказал свою аналитическую надежность в ходе тестовых испытаний на базовых текстах исследовательского корпуса.

Так, во французском этнографическом травелоге платформа четко зафиксировала полярность имперских оценок: алгоритмы выявили высокую плотность комплиментарных эстетизирующих лексем при описании оседлого мусульманского населения на фоне критического уровня стереотипизации и дегуманизации северных кочевых народов.

В то же время в британской путевой прозе коммерческой направленности софт математически подтвердил феномен так называемого миметического Востока. Инструмент зафиксировал скрытую авторскую иронию и систематическую ориентализацию самих русских чиновников, репрезентируемых в тексте как вторичные акторы, бездумно копирующие внешние атрибуты европейской цивилизации.

Наконец, на материале английских и французских женских травелогов сетевой модуль графов доказал, что западный наблюдатель практически не воспринимал автохтонный кочевой мир напрямую. Компьютерное моделирование связей показало, что образы коренных народов в тексте были жестко зажаты в сети посредников — между ментальными узлами европейских колонистов, проводников и представителей местной администрации, которые тотально рефразировали колониальный взгляд путешественниц.

На финальном этапе к обработке численных матриц через программный интерфейс подключается большая языковая модель DeepSeek. На основе строгих научных брифингов она выступает в роли беспристрастного цифрового ассистента, помогая исследователям формулировать итоговые концептуальные выводы — например, выявлять специфику женского взгляда путешественниц, где удивительным образом сочетались колониальное высокомерие и искренняя гендерная эмпатия к сибирским женщинам разных национальностей.

Разработанная платформа «DH-EuroTravel» полностью универсальна. В дальнейшем созданные Python-скрипты могут быть масштабированы на любые массивы исторических документов и дневников, описывающих межнациональные контакты на имперских фронтирах. Автор проекта отмечает, что ключевым вектором развития платформы станет её адаптация для оцифровки, обработки и глубокого семантического анализа массивов исторических и культурных данных, составляющих наследие Республики Алтай. Применение этого ИТ-инструмента к региональным архивам, записям исследователей Алтая, фольклорным и этнографическим сборам позволит открыть новые страницы в изучении межкультурного диалога в Горном Алтае, автоматизировать поиск уникальных этнокультурных маркеров и перевести сохранение исторической памяти региона на самый современный цифровой уровень.


Просмотров: 427