ხელოვნური ინტელექტით შესრულებულ თარგმანთან დაკავშირებული გამოწვევები ქართული ენის კონტექსტში
ჩამოტვირთვები
წარმოდგენილი სტატია განიხილავს იმ ძირითად გამოწვევებს, რომლებსაც ხელოვნური ინტელექტით თარგმნის სისტემები აწყდება ქართული ენის დამუშავებისას - ენისა, რომელსაც გააჩნია უნიკალური ლინგვისტური და კულტურული მახასიათებლები, თუმცა მას დაბალრესურსიან ენად მოიხსენიებენ კომპიუტერიზებული მონაცემების ნაკლებობის თვალსაზრისით. კვლევა განსაზღვრავს თარგმნის ბარიერების ორ ძირითად კატეგორიას: კულტურულ და ლინგვისტურ გამოწვევებს.
კულტურული გამოწვევები მოიცავს კულტურულად სპეციფიკური ცნებების არასწორ თარგმნას, ქართული იდიომებისა და ანდაზების არაადეკვატურ დამუშავებას და გადატანითი ენის ვერგადმოცემას. ლინგვისტური ხასიათის სირთულეებს განაპირობებს ქართული ენის აგლუტინაციური ბუნება, ერგატიული ბრუნების სისტემა, სიტყვათა მოქნილი რიგი და პოლიპერსონალური შეთანხმების მოდელები. ქართული ზმნის ერთ მორფოლოგიურ ერთეულში კოდირებულია სუბიექტი, ობიექტი, დრო, ასპექტი და მიმართულება, რაც სირთულეებს ქმნის ხელოვნური ინტელექტის ისეთის სისტემებისთვის, რომლებიც ძირითადად სტრუქტურულად განსხვავებულ ენებზეა აგებული.
ნეირონული მანქანური თარგმნის არსებული სისტემები, მათ შორის Google Translate და DeepL, მუდმივად სირთულეებს აწყდება ქართულთან მიმართებაში, რაც გამოწვეულია მონაცემთა შეზღუდული ბაზებითა და ქართული ენის მორფოლოგიური სირთულის არაადეკვატურად დამუშავებით, რის შედეგადაც მიიღება უხერხული ან კულტურულად შეუფერებელი თარგმანები. კვლევის შედეგები ხაზს უსვამს ბუნებრივი ენების დამუშავების (NLP) სპეციალიზებული მიდგომების აუცილებლობას ისეთი მორფოლოგიურად რთული, დაბალრესურსიანი (ციფრული მონაცემების თვალსაზრისით) ენებისთვის, როგორიცაა ქართული და ხაზგასმით აღნიშნავს ხელოვნური ინტელექტით თარგმნის სისტემებში კულტურული კონტექსტის ინტეგრირების მნიშვნელობას.
Downloads
Cieri, C., Maxwell, M., Strassel, S., & Tracey, J. (2016). Challenges and opportunities in language resource development for low-resource languages. Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC'16), 4543-4550. https://aclanthology.org/L16-1720/
Digital Laboratory of the Georgian Language. (n.d.). University of Georgia. Retrieved August 3, 2025 from https://dlab.ug.edu.ge
Ganmarteba.ge. (n.d.). Georgian Dictionary. Retrieved July 20, 2025, from https://www.ganmarteba.ge
Hewitt, B. G. (1995). Georgian: A structural reference grammar. John Benjamins Publishing. https://doi.org/10.1075/loall.2
Makharoblidze T. (n.d.). Polypersonal verbal categories in Georgian sign language. Ilia University Repository. Retrieved July 30, 2025 from https://eprints.iliauni.edu.ge/3051/1/polypersonalism%205.pdf
Magueresse, A., Carles, V., & Heinecke, J. (2020). Low-resource languages: A review of past work and future challenges. arXiv preprint arXiv:2006.07264. https://arxiv.org/abs/2006.07264
Thuleen N. (n.d.). The Verbal Syntax and Ergativity of Georgian. Retrieved from https://www.nthuleen.com/papers/L12paper.html
Science Co., Ltd. (2022). The evolution of machine translation: From rule-based to neural machine translation. Science.co.jp. Retrieved July 28, 2025 from https://www.science.co.jp/en/nmt/blog/32553/
Shota Rustaveli National Science Foundation. (n.d.). Fund of Georgian idioms and proverbs. Tbilisi State University. Retrieved July 26, 2025 from https://idioms.tsu.ge/
Tandaschvili, M. (2025). Low-resource languages in the digital age: A new paradigm for linguistic classification [Unpublished manuscript]. Ilia State University. https://eprints.iliauni.edu.ge/
The Free Dictionary. (n.d.). Sit (idly) by. In Idioms. Retrieved July 25, 2025, from https://idioms.thefreedictionary.com
საავტორო უფლებები (c) 2025 ქართველი მეცნიერები

ეს ნამუშევარი ლიცენზირებულია Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 საერთაშორისო ლიცენზიით .

