ISBN 974-13-2029-9
ราคา 175 บาท

สนใจซื้อได้ที่
โครงการเผยแพร่ผลงานวิชาการ
คณะอักษรศาสตร์  จุฬาลงกรณ์มหาวิทยาลัย
ถนนพญาไท  เขตปทุมวัน  กรุงเทพฯ 10330
โทรศัพท์ 02-2184888  โทรสาร 02-2184878
หรือที่ ศูนย์หนังสือแห่งจุฬาลงกรณ์มหาวิทยาลัย

สารบัญ

บทที่ 1 คลังข้อมูลภาษา 1
1 คลังข้อมูลภาษาคืออะไร 1
2 ความเป็นมาของภาษาศาสตร์คลังข้อมูล 3
3 ขอบเขตของภาษาศาสตร์คลังข้อมูล 8
4 พัฒนาการของคลังข้อมูลภาษา 9
4.1 คลังข้อมูลยุคแรก 11
4.1.1 Brown Corpus 11
4.1.2 Lancaster-Oslo/Bergen (LOB) Corpus 12
4.1.3 London-Lund Corpus (LLC) 13
4.2 คลังข้อมูลยุคที่สอง 13
4.2.1 The Cobuild Project 14
4.2.2 The Longman Corpus Network 15
4.2.3 The British National Corpus 16
4.2.4 The International Corpus of English (ICE) 18
5. ประเภทของคลังข้อมูลภาษา 18
6. ความหมายของ CORPUS และ ARCHIVE 20
7. คำนวณภาพขนาดของคลังข้อมูล 21
8. ปัจจุบันและอนาคตของภาษาศาสตร์คลังข้อมูล 22

บทที่ 2 ประโยชน์ของคลังข้อมูลภาษา 24
1. บทนำ  24
2. ประโยชน์ด้านการเรียนการสอนภาษา 26
2.1 การนำคลังข้อมูลภาษามาใช้เป็นหลักในการสอนภาษา 33
2.1.1 วิธีการเรียนการสอนด้วยการใช้คลังข้อมูลภาษา 33
2.1.2 บทบาทของผู้เรียนและผู้สอนในชั้นเรียน 34
2.2. การประยุกต์ใช้คลังข้อมูลภาษาในการสอนภาษา 36
3. ประโยชน์ด้านการวิจัยทางภาษาศาสตร์ 44
3.1 การศึกษาระดับคำ 47
3.2 การศึกษาระดับโครงสร้าง 49
3.3 การศึกษาด้าน ESP และการแปรตามทำเนียบภาษา 50
4. หัวข้อในการวิจัยทางภาษาศาสตร์ด้วยคลังข้อมูลภาษา 52
4.1 การศึกษาเรื่องคำ  52
4.2 การศึกษาเรื่องไวยากรณ์ที่เน้นเรื่องคำและหน่วยคำ 52
4.3 การศึกษาเรื่องไวยากรณ์ที่เน้นเรื่องประโยค 55
4.3.1 การศึกษาความยาวประโยค 55
4.3.2 การศึกษากระบวนการทางไวยากรณ์ 55
4.4 การศึกษาวัจนกรรมในภาษาพูด 56
4.5 การศึกษาด้านการแปรของภาษา 57
5. ประโยชน์ด้านการแปลภาษา 59
5.1 ความเป็นมาของศาสตร์การแปล 62
5.2 ทฤษฎีระบบหลายขั้ว 64
5.3 แนวคิดเรื่องรูปแบบปกติ 66
5.4 คลังข้อมูลภาษากับศาสตร์การแปลแบบพรรณา 66
5.5 ศาสตร์การแปลและการวิเคราะห์เปรียบต่าง 68
5.6 การศึกษาลักษณะเฉพาะของภาษาแปล 69
5.6.1 การศึกษาการเบี่ยงเบนจากระบบและรูปแบบปกติ 70
5.6.2 การศึกษาสากลลักษณ์ของการแปล 70
5.7 การใช้คลังข้อมูลภาษาเพื่อช่วยในการแปล 73
5.7.1 การใช้คลังข้อมูลในการสอนแปล 74
5.7.2 การใช้คลังข้อมูลเป็นทรัพยากรการแปล 80
6 ประโยชน์ด้านการประมวลผลภาษาธรรมชาติ 96
6.1 ความสัมพันธ์ระหว่างภาษาศาสตร์และสถิติ 97
6.2 การใช้สถิติในการแก้ปัญหาความกำกวม 106
7. สรุป   116

บทที่ 3 การออกแบบและจัดสร้างคลังข้อมูลภาษา 117
1. ข้อควรพิจารณา 117
1.1 วัตถุประสงค์ 117
1.2  ลักษณะของคลังข้อมูลเป็นแบบสถิตย์หรือแบบพลวัต 118
1.3 การเป็นตัวแทนภาษาและความสมดุล 119
1.4 ขนาดของคลังข้อมูลภาษา 120
1.5 การป้อนข้อมูลเข้า 123
2. ขั้นตอนในการจัดสร้างคลังข้อมูลภาษา 124
2.1 การออกแบบโครงสร้าง 124
2.2 วางแผนการเก็บข้อมูล 125
2.3 ขออนุญาตเจ้าของลิขสิทธิ์ 126
2.4 การป้อนข้อมูลเข้า 128
2.5 การกำกับข้อมูล 129
3 ตัวอย่างการจัดสร้างคลังข้อมูลภาษา 129
3.1 คลังข้อมูล CSAE 130
3.1.1 แรงจูงใจ 130
3.1.2 ประโยชน์ที่คาดไว้ 130
3.1.3 สิ่งที่คำนึงถึงในการสร้างคลังข้อมูล CSAE 131
3.1.4 ขั้นตอนของการสร้าง CSAE 133
3.2 คลังข้อมูล BNC 134
3.2.1 ลักษณะทั่วไป 134
3.2.2 การคัดเลือกข้อมูล 135
3.2.3 การสร้างคลังข้อมูล BNC 138

บทที่ 4 การกำกับข้อมูลในคลังข้อมูลภาษา 141
1. เหตุผลที่มีการกำกับข้อมูล 141
2. การกำกับข้อมูลคืออะไร 144
3. หน้าที่และบทบาทของ TEI 145
4. SGML  146
4.1 องค์ประกอบของเอกสาร SGML 148
4.1.1 SGML Declaration 148
4.1.2 Document instance 150
4.1.2 Document Type Definition (DTD) 151
4.2 การกำหนดโครงสร้างซ้อน 161
4.3 การกำหนดส่วนเฉพาะ 163
4.4 ตัวอย่างของแฟ้มข้อมูลที่กำกับด้วย SGML 164
5. แท็กพื้นฐานที่กำหนดโดย TEI 166
5.1 โครงสร้างของเอกสารตามข้อกำหนด TEI 167
5.2 การกำกับข้อมูลส่วนเนื้อความ 169
5.3 การกำกับข้อมูลในคลังข้อมูลภาษา 171
5.4  การกำกับคลังข้อมูลภาษาตามแนวทางของ TEI 173
5.4.1 การกำกับข้อมูลบริบท 174
5.4.2 การกำกับข้อมูลทางภาษาศาสตร์ 182
6. สรุป   184

บทที่ 5 โปรแกรมคอนคอร์แดนซ์ 186
1. บทนำ  186
2. ประเภทของโปรแกรมคอนคอร์แดนซ์ 188
3. การค้นข้อมูล 189
4. การแสดงผล 190
5. ข้อจำกัดของโปรแกรมคอนคอร์แดนซ์ 191
6. ประโยชน์ของโปรแกรมคอนคอร์แดนซ์ 192
6.1 ประโยชน์ด้านการวิจัยทางภาษาศาสตร์ 192
6.2 ประโยชน์ด้านการสอนภาษา 193
6.3 ประโยชน์ในงานประยุกต์อื่นๆ 193
7. ข้อควรระวัง 195
8 ตัวอย่างโปรแกรมคอนคอร์แดนซ์ 199
8.1 โปรแกรม Concordancer for Windows 200
8.2 โปรแกรม Word Smith 205
8.3 โปรแกรม MonoConc 208
8.4 โปรแกรม TACT 211

บทที่  6 คำปรากฎร่วม 213
1. บทนำ  213
2. การใช้ความถี่ 217
3 การใช้ค่าเฉลี่ยและความแปรปรวน 218
4. การทดสอบสมมติฐาน 219
4.1 การทดสอบ t-test 220
4.2 การทดสอบ Pearson's chi-square 223
4.3 การทดสอบ Berry-Rogghe's z-score 225
4.4 การทดสอบค่า Likelihood ratio 229
5 การใช้ค่า mutual information 230
6. การทดสอบแบบอื่นๆ 232
7. คำปรากฏร่วมของคำมากกว่าสองคำ 234
8. คำปรากฏร่วมระหว่างสองภาษา 235
9. สรุป   236

ภาคผนวก
ทรัพยากรคลังข้อมูลภาษาบนอินเตอร์เน็ต 237
บรรณานุกรม 239