მეგრული ტექსტების დოკუმენტირება და ანოტირება FLEx-ში
DOI:
https://doi.org/10.52340/lac.2023.05ანოტაცია
მეგრული უმწერლობო ქართველური ენაა და ფუნქციონირებს მისი ორი დიალექტის, ზუგდიდურ-სამურზაყანოულისა და სენაკურ-მარტვილურის, სახით. სტატიაში მეგრული ენის თანამედროვე ზეპირ მონაცემები, დამუშავებულია და გაანალიზებულია მეგრულენოვანი ჩანაწერების ლექსიკური და გრამატიკული მონაცემები FLEx-ის (FieldWorks Language Explorer) პროგრამის გამოყენებით. მოცემული ეტაპისათვის FLEx-ის ბაზაში შეტანილი და გაანალიზებულია 49 ტექსტი (ტოკენი - 38519, უნიკალური ფორმა -26610, წინადადება -3480). დიალოგები და მონოლოგები ჩაწერილია ორივე დიალექტურ არეალში და თემატურად მრავალფეროვანია. ყველა ტექსტს ახლავს თავისუფალი თარგმანი ქართულ და ინგლისურ ენებზე.
მორფოსინტაქსური ანალიზი მოიცავს შემდეგ სტრიქონებს:
- Word base – წინადადებების დაყოფა სიტყვებად ავტომატურია.
- Word ipa სტრიქონი - მეგრული ტექსტის საერთაშორისო ფონეტიკური ანბანური ჩანაწერის მომზადება ონლაინ კონვერტორში, რომელშიც შემუშავებულია კონვერტაციის სამი ძირითადი მიმართულება (გერსამია, ლობჟანიძე 2022). პირველი გულისხმობს ქართულ დამწერლობაზე დაფუძნებული მეგრულიდან საერთაშორისო ფონეტიკურ ანბანზე (IPA) გადასვლას, მეორე – მეგრულიდან ISO 9984 რომანიზაციის სქემაზე და მესამე გამყრელიძე-მაჭავარიანის ტრანსლიტერაციის სისტემაზე (1965 წ.) და პირუკუ.
- Morphemes - სიტყვების მორფოლოგიური სეგმენტირება მანუალური პროცესია. სტრიქონში ფორმათა (ძირი, ფუძე, აფიქსი) მორფოსინტაქსური მონაცემი მანულურად ხდება. სტრიქონი ასახავს ტექსტში ფიქსირებულ მონაცემებს.
- მორფოსინტაქსური ანოტირება სამსტრიქონიანი და შეიცავს: Lex. Entries, Lex. Gloss, Lex. Gram. Information-ს და სემიმანუალური პროცესია. ინფორმაცია მორფემათა ვარიანტების, ამოსავალი მორფემების შესახებ აღწერილია Entries-ში, ხოლო Lex. Gloss.-ში მოცემულია მორფოსინტაქსური ანოტაცია. ტეგები ემყარება ლაიფციგის გლოსირებასა და ევროტიპის სპეციფიკაციას. ახალი ტეგები მუშავდება მეგრული ენის მორფოსინტაქსის გათვალისწინებით.
ამავე სტრიქონში ითარგმნება ძირული მორფემები ინგლისურად. სტრიქონი Gram. Information უზრუნველყოფს სეგმენტირებულ მონაცემებთან დაკავშირებული გრამატიკული კატეგორიების შესახებ ინფორმაციის ასახვას.
- POS - მეტყველების ნაწილთა მიხედვით სიტყვების ანოტირების ველია.
ველზე მოპოვებული მეგრული ტექსტების მორფოსინტაქსური ანოტირება FLEx-ში საფუძვლად დაედება მეგრული ენის ფორმალურ გრამატიკას და ონლაინ ლექსიკონს.
##plugins.generic.usageStats.downloads##
წყაროები
გუდავა ტ., - ქართული ხალხური სიტყვიერება, მეგრული ტექსტები, I, პოეზია, გამომცემლობა „თბილისის უნივერსიტეტი“. თბილისი 1975.
კარტოზია გ., გერსამია რ., ლომია მ., ცხადაია თ., - მეგრულის ლინგვისტური ანალიზი. გამომცემლობა “მერიდიანი”. თბილისი 2011.
ლობჟანიძე ი., - ქართული ენის მორფოსინტაქსური ანოტირებისა და სასრული პოზიციის მორფოლოგიური ანალიზის პრინციპები. ილიას სახელმწიფო უნივერსიტეტის გამომცემლობა, თბილისი 2021
მახარობლიძე თ., - დერივანტების შესახებ, ლინგვისტური წერილები IV, გამომცემლობა “წიგნის ფაბრიკა”. თბილისი 2018.
მელიქიშვილი ი., - ფლექსიურობის (ფუზიურობის) შესახებ ქართველურ ენებში, ენათმეცნიერების საკითხები, I-II. 2010.
ქირია ჭ., ეზუგბაია ლ., მემიშიში მ., ჩუხუა მ., - ლაზურ-მეგრულის მორფოლოგია I. გამომცემლობა “მერიდიანი”. თბილისი 2015
ქობალავა ი., - სივრცისა და მოძრაობის ენობრივი რეპრეზენტაცია (მეგრული ენის მონაცემთა ანალიზი). ილიას სახელმწიფო უნივერსიტეტის გამომცემლობა. თბილისი 2020.
ჩიქობავა არნ., - ჭანურის გრამატიკული ანალიზი. სსრკ მეცნიერებათა აკადემიის საქართველოს ფილიალის გამოცემა. ტფილისი. 1936
Austin, P. K. - Current issues in language documentation. In Peter K. Austin (ed.) Language Documentation and Description, Volume 7:12-33. London: SOAS. 2010.
Austin, P. K. - Language documentation and meta documentation. Keeping Languages Alive (Documentation, Pedagogy and Revitalization). Eds. M.C Jones and S. Ogilvie. Cambridge University Press.2013
Gamkrelidze, T., Machavariani, G. - The system of sonants and ablaut in the Kartvelian languages. Tbilisi: Science. 1965.
Gersamia, R., Lobzhanidze, I. - Mingrelian Converter.
https://irinalobzhanidze.com/megrelian/converter/converter.html. Accessed 15 June, 2022.
Himmelmann, N. P. - Documentary and descriptive linguistics. Linguistics 36,161-195. 1998.
Kobalava I., Gersamia R. - Space and Motion in Language Representation (Analyses of Megrelian and Laz Linguistic Data), Tbilisi. 2020, Ilia State University. 2020.
Lehmann, Ch. Language documentation. A program. In Walter Bisang (ed.) Aspects of Typology and Universals, 83-97. Berlin: Akademie Verlag. 2001.