Чи знаєте ви, що то таке – ГРАК? Ні, не той грак, що з роду гайворонів, а той ГРАК, що з лінгвістики й цифрових технологій народився? Саме про нього 14 червня 2023 року йшлося на зустрічі студентів спеціальностей «Філологія. Слов’янські мови та літератури (переклад включно), перша-польська», «Філологія. Українська мова та література», «Середня освіта (Мова і література (польська))», «Середня освіта (Українська мова і література)» з Марією Шведовою, кандидаткою філологічних наук, доценткою кафедри прикладної лінгвістики Національного університету «Львівська політехніка», співробітницею Єнського університету імені Фрідріха Шиллера (Німеччина), яка є співтворцем продукту під назвою ГРАК – Генеральний регіонально анотований Корпус української мови.
Генеральний регіонально анотований корпус української мови (ГРАК) – це велика, репрезентативна, структурована колекція текстів українською мовою у супроводі програми, яка дозволяє будувати на базі корпусу власні підкорпуси, шукати слова, граматичні форми та їх сполучення, а також обробляти результати пошуку, сортувати, робити збалансовані вибірки і одержувати різну статистичну інформацію [http://uacorpus.org/Kyiv/ua].
Цікавим ГРАК є ще й тому, що ця пошукова база складається з великої кількості текстів, зібраних таким чином, щоб там були тексти різних часів, різних авторів, різних регіонів, різних жанрів, а лінгвістичний програмний інструментарій, який дозволяє працювати з цим матеріалом. ГРАК – це справжнісінька знахідка для тих, хто пише наукові роботи (курсові, дипломні) з мови, і не лише з української. Розробники корпусу надають посилання на інші корпуси української мови та слов’янських мов [http://uacorpus.org/Kyiv/ua/other-ukrainian-corpora]. Корпус текстів української мови постійно доповнюється, розширюючи свої географічні й хронологічні горизонти. І все це завдяки клопітливій праці не лише створювачів продукту, а й студентства.
Студенти-лінгвісти різних вишів України – активні учасники наповнення корпусу новими текстовими матеріалами, які вони опрацьовують відповідно до вимог і додають до корпусу, створюючи тим самим умови для користувачів. Адже в корпусі можна не тільки шукати слово чи точну форму, як в Гуглі, можна шукати граматичну форму, можна шукати поєднання слів граматичних форм, різні складні синтаксичні конструкції і можна отримувати якусь статистичну інформацію, важливу для лінгвістичних досліджень. Про них ГРАК з вдячністю інформує на своїх сторінках [http://uacorpus.org/Kyiv/ua/gracinfo/rozrobniki].
За час зустрічі учасники отримали багато інформації про те, які є версії ГРАКу, як користуватися пошуковою системою, коли необхідно знайти слово чи словоформу, окремі фрази чи словосполучення.
Звісно, звучало й немало питань щодо лінгвістики, перекладу, пошукової системи, з’являлися дискусійні питання для обговорення. Згодом пані Марія у Фейсбуці відзначила зустріч у Хмельницькому національному університеті:
Пані Марія ознайомила всіх слухачів з функціоналом і можливостями ГРАКу, зацікавила пропозицією співпраці наших студентів і викладачів з ГРАКом, висловила сподівання, що й наші студенти захочуть долучитися до непростої, але цікавої роботи над текстовим наповненням корпусу. Сподіваємося, що ГРАК зів’є гніздо й у нашому університеті.
Людмила Терещенко,
старший викладач кафедри слов’янської філології