Results of the analysis of Megrelian texts in the FLEx program
Keywords:
Megrelian texts, database, data annotationAbstract
The scientific project "Annotated Corpus of the Megrelian Language with Formal Grammar and Electronic Dictionary" involves the processing of materials collected in Samegrelo during 2022-2023 using the FieldWorks Language Explorer (FLEx, SIL International 2024) program. This program provides data management and facilitates the creation of an online grammar, dictionary, and database, ultimately resulting in an automatically generated Megrelian-English dictionary and a brief formal grammar.
After the data annotation, the annotated texts have been made available online in the form of a database. In this database, or, in other words, in the annotated corpus of the Megrelian language, the following information is included: translations of texts split into sentences in Georgian and English, transcription using IPA (International Phonetic Alphabet), morpheme-based annotation of words based on the Leipzig Glossing Rules and Eurotyp's guiding principles, and POS (part-of-speech) annotation.
At this stage, the FLEx corpus contains 149 texts of various lengths selected from the texts obtained during fieldwork in 2022-2024, comprising 9,235 sentences, 97,329 tokens, and 30,479 unique forms. A dictionary and a brief formal grammar have been compiled during the work on the data.
The Megrelian-English dictionary is based on morphosyntactically annotated data entered into the FLEx environment. It is possible to create lexicons structured around either lexemes or morphemes (roots, affixes), or both. The brief formal grammar is based on the morphological segmentation of words and the classification of morphemes within FLEx.
Downloads
References
კარტოზია, გ., გერსამია, რ., ლომია, მ., ცხადაია, თ., - მეგრულის ლინგვისტური ანალიზი, თბილისი: გამომცემლობა „მერიდიანი“. 2010. 699 გვ.
მელიქიშვილი, ი., - ფლექსიურობის (ფუზიურობის) შესახებ ქართველურ ენებში. სამეცნიერო კრებული „ენათმეცნიერების საკითხები“, # I-II, გვ. 84-106. თბილისი. 2010.
ქირია,ჭ., ეზუგბაია, ლ., მემიშიში, ო., ჩუხუა, მ., - ლაზურ-მეგრული გრამატიკა. I. მორფოლოგია. თბილისი: გამომცემლობა „მერიდიანი“. 2015. 900 გვ.
ქობალავა, ი., - გე- ზმნისწინის მნიშვნელობისათვის მეგრულში: სამეცნიერო კრებული „ენათმეცნიერების საკითხები“, 4, გვ. 166-174. თბილისი. 2002.
ქობალავა, ი., - აწმყოს ფუძის ერთი თავისებურებისათვის მეგრულში (გრამატიკული და სემანტიკური ასპექტები): სამეცნიერო კრებული „ენათმეცნიერების საკითხები“, #I-II, გვ. 234-251. თბილისი. 2010.
Comrie, B., Haspelmath, M., and Bickel, B. (2008). The Leipzig Glossing Rules: Conventions for Interlinear Morpheme-by-morpheme Glosses. Leipzig: Max Planck Institute for Evolutionary Anthropology.
International, SIL. 2024. SIL Feildworks Language Explorer (FLeX), Version 9.1. January 01. https://software.sil.org/fieldworks/.
Lehmann, Ch., 2004, “Interlinear morphemic glossing.” In Booij, G., Mugdan, J., & Skopeteas, St., (eds.), Morphologie. Ein internationales Handbuch zur Flexion und Wortbildung. 2. Halbband. Berlin & New York: W. de Gruyter (Handbücher zur Sprach- und Kommunikationswissenschaft, 17.2). pp.1834-1857.
Lobzhanidze I., Gersamia R., Tsulaia N., Compiling a bilingual Megrelian-English online dictionary – Preserving endangered Kartvelian languages. In K. Š. Despot, A. Ostroški Anić, & I. Brač (Eds.), Lexicography and semantics: Proceedings of the XXI EURALEX International Congress Cavtat, Croatia. pp. 614-627.