FLEx-ის პროგრამაში მეგრული ტექსტების ანალიზის შედეგები

FLEx-ის პროგრამაში მეგრული ტექსტების ანალიზის შედეგები

ავტორები

DOI:

https://doi.org/10.52340/lac.2024.32.05

საკვანძო სიტყვები:

მეგრული ტექსტები, მონაცემის ბაზის შექმნა, ანოტირებული ტექსტები

ანოტაცია

სამეცნიერო პროექტი „მეგრული ენის ანოტირებული კორპუსი ფორმალური გრამატიკითა და ელექტრონული ლექსიკონით“ გულისხმობს სამეგრელოში 2022-2023 წლებში ველზე მოპოვებული მასალის დამუშავებას FieldWorks Language Explorer (FLEx, SIL International 2024)  პროგრამის გამოყენებით, რომელიც უზრუნველყოფს მონაცემთა მართვას, ონლაინ გრამატიკის, ლექსიკონისა და მონაცემის ბაზის შექმნას, რის საფუძველზეც საბოლოოდ მიიღება პროგრამიდან ავტომატურად გენერირებული მეგრულ-ინგლისური ლექსიკონი და მოკლე ფორმალური გრამატიკა.

მონაცემების ანოტირების შემდეგ ანოტირებული ტექსტები მონაცემთა ბაზის სახით განთავსდა ინტერნეტში. აღნიშნულ ბაზაში, სხვაგვარად რომ ვთქვათ, მეგრული ენის ანოტირებულ კორპუსში, განთავსდა შემდეგი ინფორმაცია: წინადადებებად დაშლილი ტექსტების ქართულ და ინგლისურენოვანი თარგმანები, ტრანკრიფცია IPA - საერთაშორისო ფონეტიკური ანბანის გამოყენებით, მორფემებად დაშლილი სიტყვების ანოტაცია ლაიფციგის გლოსირების წესებსა და ევროტიპის სახელმძღვანელო პრინციპებზე დაყრდნობით, POS - მეტყველების ნაწილთა ანოტაცია.

ამ ეტაპისათვის FLEx-ის კორპუსში წარმოდგენილია 2022-2024 წლის საველე სამუშაოებისას მოპოვებული ტექსტებიდან გადარჩეული სხვადასხვა მოცულობის 149 ტექსტი, რაც შეადგენს 9 235 წინადადებას, 97 329 ტოკენს, 30 479 უნიკალური ფორმას.  მონაცემებზე მუშაობის დროს შედგენილი ლექსიკონი და მოკლე ფორმალური გრამატიკა.

მეგრულ-ინგლისური ლექსიკონი ეფუძნება FLEx-ის გარემოში შეტანილი ტექსტების მორფოსინტაქსურად ანოტირებულ მონაცემებს.  FLEx-დან შესაძლებელია შეიქმნას სტრუქტურულად ლექსემასა და მორფემაზე (ძირი, აფიქსები), ან ორივეზე დაფუძნებული ლექსიკონები. მოკლე ფორმალური გრამატიკა ეფუძნება FLEx-ში სიტყვების მორფოლოგიურ სეგმენტირებას და მორფემათა კლასიფიკაციებს.

 

##plugins.generic.usageStats.downloads##

##plugins.generic.usageStats.noStats##

წყაროები

კარტოზია, გ., გერსამია, რ., ლომია, მ., ცხადაია, თ., - მეგრულის ლინგვისტური ანალიზი, თბილისი: გამომცემლობა „მერიდიანი“. 2010. 699 გვ.

მელიქიშვილი, ი., - ფლექსიურობის (ფუზიურობის) შესახებ ქართველურ ენებში. სამეცნიერო კრებული „ენათმეცნიერების საკითხები“, # I-II, გვ. 84-106. თბილისი. 2010.

ქირია,ჭ., ეზუგბაია, ლ., მემიშიში, ო., ჩუხუა, მ., - ლაზურ-მეგრული გრამატიკა. I. მორფოლოგია. თბილისი: გამომცემლობა „მერიდიანი“. 2015. 900 გვ.

ქობალავა, ი., - გე- ზმნისწინის მნიშვნელობისათვის მეგრულში: სამეცნიერო კრებული „ენათმეცნიერების საკითხები“, 4, გვ. 166-174. თბილისი. 2002.

ქობალავა, ი., - აწმყოს ფუძის ერთი თავისებურებისათვის მეგრულში (გრამატიკული და სემანტიკური ასპექტები): სამეცნიერო კრებული „ენათმეცნიერების საკითხები“, #I-II, გვ. 234-251. თბილისი. 2010.

Comrie, B., Haspelmath, M., and Bickel, B. (2008). The Leipzig Glossing Rules: Conventions for Interlinear Morpheme-by-morpheme Glosses. Leipzig: Max Planck Institute for Evolutionary Anthropology.

International, SIL. 2024. SIL Feildworks Language Explorer (FLeX), Version 9.1. January 01. https://software.sil.org/fieldworks/.

Lehmann, Ch., 2004, “Interlinear morphemic glossing.” In Booij, G., Mugdan, J., & Skopeteas, St., (eds.), Morphologie. Ein internationales Handbuch zur Flexion und Wortbildung. 2. Halbband. Berlin & New York: W. de Gruyter (Handbücher zur Sprach- und Kommunikationswissenschaft, 17.2). pp.1834-1857.

Lobzhanidze I., Gersamia R., Tsulaia N., Compiling a bilingual Megrelian-English online dictionary – Preserving endangered Kartvelian languages. In K. Š. Despot, A. Ostroški Anić, & I. Brač (Eds.), Lexicography and semantics: Proceedings of the XXI EURALEX International Congress Cavtat, Croatia. pp. 614-627.

ჩამოტვირთვები

გამოქვეყნებული

2024-11-20

გამოცემა

სექცია

ენათმეცნიერება
Loading...