پیکره متنی
در زبانشناسی پیکرهای، پیکرهٔ متنی یا پیکرهٔ واژگانی (بهاختصار: پیکره) (به انگلیسی: text corpus, corpus) به مجموعهای خام از دادههای زبانیِ نوشتاری یا گفتاری گفته میشود که میتوان در توصیف و تحلیل زبان از آن بهره گرفت، از جمله در ارزیابیها و تحلیلهای آماریِ زبانشناختی و نیز در فرهنگنویسی، دستورنویسی، گویششناسی و جز آنها.[1]
روشهای فراهم ساختن پیکره
در گذشته، فراهم ساختن پیکرههای زبانی برای تألیف فرهنگ بسیار وقتگیر، پرزحمت و پرهزینه بود؛ مثلاً علیاکبر دهخدا و همکارانش برای تألیف لغتنامه سالیان درازی متون منظوم و منثور زبان فارسی را سطربهسطر خواندند و برگههای انبوهی حاوی واژهها، شواهد و ارجاعات آنها فراهم آوردند. مجموعهٔ دادههای زبانیای که دهخدا و یارانش به روش سنتیِ برگهنویسی فراهم آوردند، بهلحاظ حجم، بهویژه در مورد متون کهن زبان فارسی، در آن زمان و حتی تا زمانهٔ ما، بینظیر بوده و هست. امروزه، پیشرفتهای شگرف بشر در زمینهٔ فناوری اطلاعات، بهویژه رایانه، استفاده از این ابزار را برای گردآوری دادههای زبانی و تألیف فرهنگهای مختلف براساس این دادهها ناگزیر میسازد؛ چنانکه در کشورهای پیشرفته، روش سنتی گردآوری دادهها بهکلی متروک شده و فرهنگهای گوناگونی، ازجمله کوبیلد (COBUILD)، فرهنگ بیستجلدی آکسفورد و جز آنها براساس پیکرههای زبانیِ رایانهای تألیف یا تکمیل میگردند.[2]
جستارهای وابسته
پانویس
- صادقی، علیاشرف (۱۳۹۲). فرهنگ جامع زبان فارسی، جلد آ. صص. راهنمای استفاده از فرهنگ، ص ۱۰.
- بنگرید به: صادقی، علیاشرف. فرهنگ جامع زبان فارسی، جلد «آ». ۱۳۹۲. راهنمای استفاده از فرهنگ، ص ۹.
منابع
صادقی، علیاشرف (۱۳۹۲). فرهنگ جامع زبان فارسی. آ. تهران: فرهنگستان زبان و ادب فارسی. شابک ۹۷۸-۶۰۰-۶۱۴۳-۳۷-۸.