لغة التكشيف Indexing Language : مصطلح حديث نسبيا يستعمل ألان للدلالة على مجموعة
الرموز او المصطلحات التي يستعملها المكشف في التعبير عن نتائج تحليله للمحتوى
الموضوعي للوثائق .
وكما تستعمل لغة التكشيف في تسجيل نتائج التحليل في
مرحلة المداخلات فأنها تستعمل هي نفسها أيضا في تحليل الاستفسارات التي ترد من
المستفيدين في مرحلة الاسترجاع ولهذا فأنها تعتبر لغة وسيطة بين الوثائق المختزنة
في نظام استرجاع المعلومات وبين المستفيدين من هذه الوثائق .
وتقسم لغات التكشيف إلى
فئتين رئيسيتين هما (5) :
أولا : اللغات المقيدة Controlled Languages : وهي اللغات التي تتحدد مفرداتها وتحسم مشكلاتها
الدلالية وتستقر قواعدها النحوية من البداية بحيث تكون بين يدي المكشفين أدوات عمل
جاهزة مشتملة على المداخل الكشفية في أشكال محددة ينبغي التقيد بها في التعبير عن
المحتوى الموضوعي ومن أمثلتها :
- خطط التصنيف الحصرية Classification Systems
: كتصنيف دوي العشري
وتصنيف مكتبة الكونجرس …الخ .
- قوائم رؤوس الموضوعات
Subject Heading Lists
: كقائمة رؤوس موضوعات
مكتبة الكونجرس والقائمة العربية الكبرى لرؤوس الموضوعات …الخ .
- المكانز Thesauri : ومن أمثلتها مكنز مصطلحات علم المعلومات Thesaurus of Information Science Terminology
ومكنز أيرك التربوي Thesaurus of ERIC Descriptors
ومكنز الجامعة الذي أعده مركز التوثيق والمعلومات في الأمانة العامة لجامعة الدول
العربية وتسمى هذه اللغات بالمقيدة للأسباب التالية :
1- ممارسة التحكم وفرض بعض القيود في تحديد العلاقات
الدلالية من المصطلحات المترادفة وشبه المترادفة لاختيار المصطلح المفضل على غيره
كمدخل ثم ربطه بالأشكال المرادفة بالإحالات .
2- ممارسة التحكم في صياغة المداخل المكونة من أكثر
من عنصر او مصطلح واحد ، كما هو الحال في المضاف والمضاف أليه مثل :
القطن ، تجارة .
القطن ، تسميد .
القطن ، زراعة .
بدلا من ((تجارة القطن)) و ((تسميد القطن)) و ((زراعة
القطن)) .
3- ممارسة التحكم في تجنب استعمال مصطلحات بعينها
كالمصطلحات التي يكتنفها الغموض نتيجة لتعدد معانيها او المشترك اللفظي ، او
استعمال بعض هذه المصطلحات مع تحديد مجالاتها الدلالية او حدود استعمالها .
4- استعمال صيغ بعينها للمصطلحات كأستعمال صيغ الجمع
بدلا من المفرد او العكس في بعض الأحيان مع الإحالة من الشكل غير المستعمل إلى
الشكل المستعمل .
ثانيا : اللغات غير
المقيدة Uncontrolled Languages
: وتسمى أيضا باللغات
المطلقة او الطبيعية وهي التي لا تفرض قيودا معينة على القائم بعملية التكشيف في
اختيار مصطلحات الكشافات بل تعتمد أساسا على المصطلحات والكلمات المفتاحية الدالة Keywords الواردة في نص الوثيقة او عنوانها او في مستخلصها
وبذلك فأنها تمثل لغة مؤلف الوثيقة .
وهناك ألان مقياسان لتقييم أداء لغات التكشيف وهما
الاستدعاء Recall والدقة Precision . ويتأثر الاستدعاء والدقة في
الاسترجاع بلغة التكشيف المستخدمة ومدى تخصيصها فضلا عن تأثيرهما أيضا بالطريقة
التي تستخدم بها هذه اللغة سواء في تكشيف الوثائق او في تكشيف الاستفسارات . وقد
تبين من الاختبارات التي أجريت على لغات التكشيف أن هناك تناسبا عكسيا بين
الاستدعاء والدقة وان أي ارتفاع في أحدهما يؤدي تلقائيا إلى انخفاض الأخر .