پیکره متنی

در زبان‌شناسی پیکره‌ای، پیکرهٔ متنی یا پیکرهٔ واژگانی (به‌اختصار: پیکره) (به انگلیسی: text corpus, corpus) به مجموعه‌ای خام از داده‌های زبانیِ نوشتاری یا گفتاری گفته می‌شود که می‌توان در توصیف و تحلیل زبان از آن بهره گرفت، از جمله در ارزیابی‌ها و تحلیل‌های آماریِ زبان‌شناختی و نیز در فرهنگ‌نویسی، دستورنویسی، گویش‌شناسی و جز آنها.[1]

روش‌های فراهم ساختن پیکره

در گذشته، فراهم ساختن پیکره‌های زبانی برای تألیف فرهنگ بسیار وقت‌گیر، پرزحمت و پرهزینه بود؛ مثلاً علی‌اکبر دهخدا و همکارانش برای تألیف لغت‌نامه سالیان درازی متون منظوم و منثور زبان فارسی را سطربه‌سطر خواندند و برگه‌های انبوهی حاوی واژه‌ها، شواهد و ارجاعات آن‌ها فراهم آوردند. مجموعهٔ داده‌های زبانی‌ای که دهخدا و یارانش به روش سنتیِ برگه‌نویسی فراهم آوردند، به‌لحاظ حجم، به‌ویژه در مورد متون کهن زبان فارسی، در آن زمان و حتی تا زمانهٔ ما، بی‌نظیر بوده و هست. امروزه، پیشرفت‌های شگرف بشر در زمینهٔ فناوری اطلاعات، به‌ویژه رایانه، استفاده از این ابزار را برای گردآوری داده‌های زبانی و تألیف فرهنگ‌های مختلف براساس این داده‌ها ناگزیر می‌سازد؛ چنان‌که در کشورهای پیشرفته، روش سنتی گردآوری داده‌ها به‌کلی متروک شده و فرهنگ‌های گوناگونی، ازجمله کوبیلد (COBUILD)، فرهنگ بیست‌جلدی آکسفورد و جز آن‌ها براساس پیکره‌های زبانیِ رایانه‌ای تألیف یا تکمیل می‌گردند.[2]

جستارهای وابسته

پانویس

  1. صادقی، علی‌اشرف (۱۳۹۲). فرهنگ جامع زبان فارسی، جلد آ. صص. راهنمای استفاده از فرهنگ، ص ۱۰.
  2. بنگرید به: صادقی، علی‌اشرف. فرهنگ جامع زبان فارسی، جلد «آ». ۱۳۹۲. راهنمای استفاده از فرهنگ، ص ۹.

منابع

صادقی، علی‌اشرف (۱۳۹۲). فرهنگ جامع زبان فارسی. آ. تهران: فرهنگستان زبان و ادب فارسی. شابک ۹۷۸-۶۰۰-۶۱۴۳-۳۷-۸.

پانویس

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.