Генеральний регіонально анотований корпус української мови (ГРАК)
投稿者: Jarema
Jarema
Jarema  Identity Verified
ウクライナ
Local time: 05:28
2003に入会
ドイツ語 から ロシア語
+ ...

このフォーラムのモデレーター
Aug 24, 2019

Генеральний регіонально анотований корпус української мови (ГРАК) – це велика, репрезентативна, структурована колекція текстів українською мовою у супроводі програми, яка дозволяє будувати на базі корпусу власні підкорпуси, шукати слова, граматичні форми та їх сполучен�... See more
Генеральний регіонально анотований корпус української мови (ГРАК) – це велика, репрезентативна, структурована колекція текстів українською мовою у супроводі програми, яка дозволяє будувати на базі корпусу власні підкорпуси, шукати слова, граматичні форми та їх сполучення, а також обробляти результати пошуку, сортувати, робити збалансовані вибірки і одержувати різну статистичну інформацію.

Корпус призначений для здійснення лінгвістичних досліджень з граматики, лексики, історії української літературної мови, а також для використання під час укладання словників та граматик.

Корпус може бути використаний для вивчання мови на високому рівні, також при підготовці навчальних матеріалів, підручників, навчальних словників та вправ з використанням прикладів з реальних текстів, з урахуванням частотної сполучуваності тощо.

Корпус не є взірцем нормативної української мови, в ньому можуть трапитись слова і сполучення, які не відповідають сучасним нормам літературної мови.

Корпус охоплює період з 1816 по 2019 р. і містить понад 40 тисяч текстів різних жанрів, близько 15 тисяч авторів.

Адреса: http://uacorpus.org/

ГРАК у Facebook

https://www.facebook.com/groups/488552241633414/

Генеральний регіонально анотований корпус української мови (ГРАК; англ. General Regionally Annotated Corpus of Ukrainian, GRAC http://uacorpus.org/) — це корпус української мови обсягом понад 290 млн токенів, розмічений за регіонами, призначений для здійснення лінгвістичних досліджень з граматики, лексики, історії української літературної мови, а також для використання під час укладання словників та граматик.

Групу ГРАК створено для публікації

1) новин про ГРАК і про інші корпуси української мови,

2) питань, як користуватися корпусом і що там можна знайти (тут можна просто написати тему дослідження або курсової роботи, найпевніше, що ми знайдемо у корпусі потрібний матеріал, ми просто любимо шукати будь-що у корпусі),

3) власних корпусних розвідок,

4) посилань на дослідження, зроблені на базі ГРАК.
Collapse


Andriy Bublikov
Alexander Matsyuk
 
Jarema
Jarema  Identity Verified
ウクライナ
Local time: 05:28
2003に入会
ドイツ語 から ロシア語
+ ...

このフォーラムのモデレーター
TOPIC STARTER
Інші корпуси української мови Aug 24, 2019

У розділі "Інші корпуси української мови" наведені адреси інших корпусів української мови.

 
Jarema
Jarema  Identity Verified
ウクライナ
Local time: 05:28
2003に入会
ドイツ語 から ロシア語
+ ...

このフォーラムのモデレーター
TOPIC STARTER
ГРАК-7 Dec 12, 2019

ГРАК-7 уже на сайті, виріс на 10%, обсяг корпусу тепер - 437 млн токенів.

Додано, з цікавого, романи Б. Грінченка, вичитані за старими виданнями (Dmytro Yesypenko), кілька номерів газети "Молоде життя: часопис українського пласту" 1925-1929 років (Oksana Taran і студенти спеціальності "Прикла�
... See more
ГРАК-7 уже на сайті, виріс на 10%, обсяг корпусу тепер - 437 млн токенів.

Додано, з цікавого, романи Б. Грінченка, вичитані за старими виданнями (Dmytro Yesypenko), кілька номерів газети "Молоде життя: часопис українського пласту" 1925-1929 років (Oksana Taran і студенти спеціальності "Прикладна лінгвістика" НУ ЛП), твори Михайла Жука (Alena Yavorskaya), колекцію радянських газетних матеріалів 1986-1991 років про Чорнобиль (Микола Жарких), колекцію сучасної драматургії (Ольга Сахарова), газету "Україна молода" 2010-2019 рр. (Vasyl Starko). І майже сто номерів журналу "Всесвіт" (1958-1983), які підготували студенти спеціальності "Прикладна лінгвістика" НУ Львівська "Політехніка" (дякуємо Olena Levchenko, Oksana Taran) і ЛНУ імені Івана Франка (дякуємо Solomija Buk). Другу частину готових журналів ще не встигла додати, чекають. Корпус родинних листів силами студентів збільшився вдвічі, тепер там близько 600 текстів, є і зображення листів, які поки що не доступні онлайн. Додали рукописні щоденники. Всі студенти, які готували матеріали для корпусу, можуть пошукати себе на сайті на сторінці "Розробники".

https://www.facebook.com/groups/488552241633414/
Collapse


Oksana Weiss
 
Jarema
Jarema  Identity Verified
ウクライナ
Local time: 05:28
2003に入会
ドイツ語 から ロシア語
+ ...

このフォーラムのモデレーター
TOPIC STARTER
Пошук Feb 18, 2020

На сайтах https://r2u.org.ua/ та https://e2u.org.ua/ зреалізовано перехід від українських слів у словниках до корпусу: виділіть слово в результатах пошуку, натисніть комбінацію клавіш Ctrl+Shift+4 і побачите �... See more
На сайтах https://r2u.org.ua/ та https://e2u.org.ua/ зреалізовано перехід від українських слів у словниках до корпусу: виділіть слово в результатах пошуку, натисніть комбінацію клавіш Ctrl+Shift+4 і побачите результати (простого) пошуку цього слова в корпусі ГРАК (http://uacorpus.org/).
NB: якщо ви раніше заходили на наші сайти, варто жорстко оновити сторінку (Ctrl+F5 для "Хрому"). Інакше браузер підтягне стару версію сторінки з кешу й ця нова комбінація клавіш не працюватиме.
Collapse


 


To report site rules violations or get help, contact a site moderator:


You can also contact site staff by submitting a support request »

Генеральний регіонально анотований корпус української мови (ГРАК)


Translation news in ウクライナ





Trados Business Manager Lite
Create customer quotes and invoices from within Trados Studio

Trados Business Manager Lite helps to simplify and speed up some of the daily tasks, such as invoicing and reporting, associated with running your freelance translation business.

More info »
Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

Buy now! »