• Home
  • About
  • Services
  • Demo
  • Use cases
  • Corpus
  • Developers
  • News & Events
  • Contact us
  • FAQs

Corpus
บริการคลังข้อมูล

รายการคลังข้อมูลสำหรับสมาชิก AI FOR THAI

Title
Description
Category
License
Size
Download
Citation
BEST

การวัดเปรียบเทียบสมรรถนะเพื่อพัฒนามาตรฐานการประมวลผลภาษาไทย (Benchmark for Enhancing the Standard of Thai language processing) หรือ BEST นี้ เป็นคลังข้อความภาษาไทยที่มีการกำกับขอบเขตของคำ ซึ่งใช้ในการแข่งขันซอฟต์แวร์ที่สำคัญ และเกี่ยวข้องกับการประมวลผลภาษาไทย โดยแต่ละปีจะมีการกำหนดหัวข้อการแข่งขันตามความเหมาะสม เพื่อให้ครอบคลุมเนื้อหาในการประมวลผลภาษาไทยระดับต่างๆ

ดูรายละเอียดเพิ่มเติมที่ http://thailang.nectec.or.th/best
Text
12 MB
BEST-Handwritten

ฐานข้อมูลลายมือเขียนภาษาไทย พัฒนาขึ้นเพื่อใช้ในการแข่งขัน NSC Best2019 และ NSC Best2020

การรู้จำลายมือเขียน (https://thailang.nectec.or.th/best) ฐานข้อมูลได้จากอาสาสมัครเขียนตามประโยคที่กำหนดไว้ โดยเฉลยจะอยู่ในรูปแบบแฟ้มข้อความ ascii file (.label) ชุดปี 2019 เป็นปีแรกที่แข่งขัน โจทย์ส่วนใหญ่จะยังไม่ยากมากนัก (ตัวอักษรใหญ่ ชัดเจน) ส่วนใหญ่ภาพได้จากการสแกน ชุดปี 2020 เป็นปีที่สองในการแข่งขัน โจทย์จะมีความยากมากขึ้น (ตัวอักษรเล็ก) ส่วนใหญ่ภาพได้จากกล้องถ่ายรูปในโทรศัพท์มือถือ ซึ่งมีความหลากหลายมากขึ้น โดยใน 1 รูป ได้ตัดให้เหลือ เพียง 1 บรรทัดเท่านั้นเรียบร้อยแล้ว

Image
431 MB
Blackboard Treebank

Blackboard Treebank is a Thai dependency corpus based on the LST20 Annotation Guideline. It features dependency structures, constituency structures, word boundaries, named entities, clause boundaries, and sentence boundaries. It is available in the CoNLL-U format for universal compatibility.

Text
15.4 MB
Digit-Handwritten

ฐานข้อมูลภาพลายมือเขียน ตัวเลขอารบิค (0-9) และตัวเลขไทย (๐-๙) แบ่งเป็น

  • 1) ชุดภาพที่ถ่ายจากกล้องถ่ายภาพ
  • 2) ชุดภาพที่ได้จากเครื่องสแกนเนอร์
  • 3) ชุดภาพที่ใช้สำหรับทดสอบ
  • Image
    19 MB
    IPU24

    ฐานข้อมูลคำบรรยายภาพภาษาไทยอัตโนมัติ สำหรับบรรยายรูปภาพเป็นภาษาไทยที่มีความเป็นธรรมชาติ (naturalness) มีคลังภาพพร้อมคำบรรยายภาษาไทยที่ประกอบด้วยชุดข้อมูลเปิด Microsoft COCO และชุดข้อมูลภาพถ่ายที่จัดเก็บโดยทีมวิจัยเนคเทค

    คำอธิบายชุดข้อมูลและโครงสร้างไดเรกทอรี ชุดข้อมูลที่ใช้ในการทดลองนี้ประกอบด้วย IPU24 และ test dataset โดยมีการปรับปรุงชุดข้อมูลเพื่อให้ส่วนทดสอบ (test partition) รวมมาจากทุกแหล่งข้อมูล สำหรับการฝึกและตรวจสอบโมเดล จำเป็นต้องใช้ ข้อมูลการฝึก/ตรวจสอบ (training/validation) จาก Coco Dataset 2017 ซึ่งสามารถดาวน์โหลดได้จาก: https://cocodataset.org/#download

    Image
    5.27 GB
    Lexitron 2.0

    คลังคำศัพท์ไทย<->อังกฤษ ซึ่งประกอบด้วยคำศัพท์ ชนิดของคำ (part of speech) คำแปล คำเหมือน (synonym) และประโยคตัวอย่างการใช้งาน โดยมีรายการคำศัพท์ไทย->อังกฤษ จำนวน 53,000 คำ และรายการคำศัพท์อังกฤษ->ไทยจำนวน 83,000 คำ

    ดูรายละเอียดเพิ่มเติมที่ http://lexitron.nectec.or.th
    Text
    6 MB
    Lotus

    เป็นฐานข้อมูลเสียงพูดภาษาไทยขนาดใหญ่ พัฒนาขึ้นเพื่อใช้ในงานวิจัยและพัฒนาระบบรู้จำเสียงพูดต่อเนื่อง (Large Vocabulary Continuous Speech Recognition: LVCSR) สำหรับภาษาไทย โดยมุ่งเน้นสำหรับพัฒนาระบบ Speech Dictation ซึ่งใช้ลักษณะการพูดแบบอ่าน (Reading style) ฐานข้อมูลประกอบด้วยชุดหน่วยเสียงสมดุล (Phonetically Balanced Set) จากฐานข้อมูลบทความข่าวหรือบทความทั่วไป เสียงพูดในฐานข้อมูล LOTUS บันทึกผ่านไมโครโฟน 2 ประเภท คือ ไมโครโฟน Close-talk คุณภาพสูง และไมโครโฟน Unidirectional ระดับคุณภาพปานกลาง โดยทำการบันทึกเสียงใน 2 สภาพแวดล้อม คือ สภาพแวดล้อมแบบห้องเงียบ และ สภาพแวดล้อมแบบสำนักงาน ซึ่งฐานข้อมูล LOTUS จะประกอบด้วย ข้อมูลเสียงพูด และข้อความถอด จากผู้พูด 24 คน

    Speech
    557 MB
    Lotus CaLLii

    ฐานข้อมูลเสียงพูดภาษาไทย บันทึกผ่านระบบคอลเซ็นเตอร์ที่เข้ารหัสสัญญาณเสียงแบบ mu-law พัฒนาขึ้นเพื่อใช้ในงานวิจัยและพัฒนาระบบระบุช่วงเวลาพูดของแต่ละบุคคล (Speaker Diarization System) และระบบรู้จำบุคคลจากเสียง (Speaker Recognition System) เนื้อหาของเสียงพูดเกี่ยวกับการแพทย์และการท่องเที่ยวโดยใช้ข้อมูลสมมติทั้งหมด เสียงพูดมาจากอาสาสมัคร 186 คน โดยมีอักษรย่อ F แทนผู้หญิง และ M แทนผู้ชาย จากแหล่งข้อมูล 4 แหล่ง ความยาวรวมทั้งสิ้น 3,863 นาที

    เนื่องจากการสร้างคลังข้อมูลเสียงถูกควบคุมด้วย พ.ร.บ. คุ้มครองข้อมูลส่วนบุคคล ผู้ที่ต้องการขอข้อมูลไปใช้งานต้องกรอกข้อมูลให้ครบถ้วนตามลิงก์นี้ (แบบฟอร์มการขอใช้ข้อมูล) วิธีการใช้งานสามารถดูได้ตามลิงก์นี้ (วิธีการใช้งาน)

    Speech
    6.9 GB
    LST20 Corpus

    LST20 Corpus เป็นคลังข้อมูลภาษาสำหรับการประมวลผลภาษาไทย ที่พัฒนาโดยศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ คลังข้อมูลนี้กำกับด้วยข้อมูลทางภาษา 5 ระดับ ได้แก่ ขอบเขตของคำ (word boundaries), ชนิดของคำ (part of speech), ขอบเขตและชนิดของชื่อเฉพาะ (named entities), ขอบเขตของประโยคย่อย (clause boundaries), และขอบเขตประโยคใหญ่ (sentence boundaries) คลังข้อมูลนี้ประกอบด้วย: 3,164,002 คำ, 288,020 ชื่อเฉพาะ, 248,181 ประโยคย่อย, และ 74,180 ประโยคใหญ่ โดยที่มีชนิดของคำทั้งสิ้นเพียง 16 แท็กเท่านั้น นอกจากนี้คลังข้อมูลนี้สร้างขึ้นจากการรวบรวมข่าว 3,745 ชิ้น ซึ่งกำกับชนิดของข่าวเอาไว้ 15 ชนิดอีกด้วย ทำให้คลังข้อมูลนี้สามารถนำไปใช้ประโยชน์ในการพัฒนาระบบการประมวลผลภาษาไทยที่มีโครงสร้างซับซ้อนได้

    Text
    13.6 MB
    NE-Corpus

    คลังข้อมูลที่ประกอบด้วยประโยคที่มีคำศัพท์เฉพาะทางเกี่ยวกับสถานที่และองค์กรปรากฏอยู่ จากแหล่งข้อมูลดิจิทัลที่เผยแพร่ทั่วไป เช่น ข้อมูลข่าว ข้อมูลประชาสัมพันธ์จากหน่วยงาน Pantip, Twitter ฯลฯ คลังข้อมูลนี้มีจำนวนทั้งสิ้น 98,153 ประโยค

    Text
    7.1 MB
    NE-Dict

    พจนานุกรมที่ประกอบด้วยคำศัพท์เฉพาะทางเกี่ยวกับสถานที่และองค์กร จากแหล่งข้อมูลดิจิทัลที่เผยแพร่ทั่วไป พจนานุกรมนี้มีจำนวนทั้งสิ้น 242,766 คำ โดยเป็นคำศัพท์เฉพาะทางเกี่ยวกับสถานที่และองค์กร ดังต่อไปนี้

  • 1) แหล่งท่องเที่ยวทั้งทางธรรมชาติและที่ประดิษฐ์ขึ้น เช่น น้ำตก ถ้ำ สวนสนุก ห้างสรรพสินค้า ฯลฯ
  • 2) สถานที่ทางศาสนา เช่น วัด โบสถ์ มัสยิด ฯลฯ
  • 3) สถานที่ทางการศึกษา ได้แก่ โรงเรียน มหาวิทยาลัย ศูนย์การเรียนรู้ ฯลฯ
  • 4) สถานที่ตามภูมิศาสตร์ เช่น คลอง แม่น้ำ ภูเขา อ่าว แหลม ทะเล ฯลฯ
  • 5) มูลนิธิ สมาคม องค์การอิสระต่าง ๆ
  • 6) หน่วยงานภาครัฐ
  • 7) บริษัท รัฐวิสาหกิจ
  • 8) ชุมชน
  • 9) จุดที่น่าสนใจอื่น ๆ ที่มีลักษณะเป็นสถานที่หรือองค์กร
  • Text
    1.99 MB
    Spoof Detection for Speech Signal
    (Thai language)

    คลังเสียงนี้ถูกสร้างและพัฒนาขึ้นมาเพื่อใช้ในการวิจัยและพัฒนาปัญญาประดิษฐ์ในการตรวจจับเสียงปลอม หรือ Spoof Detection โดยคลังเสียงแบ่งออกเป็น 2 ชุดหลักด้วยกันดังนี้

  • A. Genuine Dataset: เป็นฐานข้อมูลเสียงจริงจาก mozilla common voice corpus 13.0 ที่ถูก validated และแปลงเป็นไฟล์ .wav แล้ว โดยมีจำนวนทั้งหมด 4,583 ไฟล์ (size: 1.4 GB)
  • B. Spoof Dataset
  • 1) Text-to-Speech (VAJA): เป็นฐานข้อมูลเสียงที่นำข้อความจาก common voice corpus13.0 มาแปลงข้อความเป็นเสียงโดยใช้ VAJA ในการสังเคราะห์ขึ้นมา ขนาดไฟล์ 860 MB
  • 2) Text-to-Speech (MMS): เป็นฐานข้อมูลเสียงที่นำข้อความจาก common voice corpus13.0 มาแปลงข้อความเป็นเสียงโดยใช้ MMS ในการสังเคราะห์ขึ้นมา ขนาดไฟล์ 1.4 GB
  • 3) Fundamental Frequency modification: เป็นฐานข้อมูลเสียงที่นำเสียงจริงจาก common voice corpus 13.0 มาปรับค่า Fundamental frequency(F0) โดยใช้ Framework World Vocoder โดยเป็นการวิเคราะห์และสังเคราะห์เสียงใหม่โดยปรับความถี่ของเสียงให้เปลี่ยนแปลงเท่านั้น การปรับค่าพารามิเตอร์ในการสังเคราะห์เสียง จะทำให้เสียงที่ผ่านการปรับความถี่มีลักษณะคลื่นเหมือนกับเสียงเดิมโดยแบ่งออกเป็น 4 set ดังนี้
  • 2.1) F0-10 Size: 1.4 GB
  • 2.2) F0-40 Size : 1.4 GB
  • 2.3) F0-160 Size : 107 MB
  • 2.4) F0-320 Size : 1.4 GB
  • รวม 4 ชุด ขนาดไฟล์รวม 4.2 GB

  • 4) Pitch - Shift: เป็นฐานข้อมูลเสียงที่นำเสียงจริงจาก common voice corpus 13.0 มาปรับ Pitch-Shift เมื่อค่า rate มีค่าน้อยกว่า 1.0 จะทำให้เสียงเล่นหน่วงลงและช้ากว่าเสียงเดิม นั่นคือ เสียงที่ผ่านการปรับเปลี่ยนค่านี้จะมีระยะเวลาที่ยาวกว่าเสียงเดิม แต่ความสูงเสียงจะคงที่และไม่เปลี่ยนแปลง แต่ถ้าค่า rate มีค่ามากกว่า 1.0 จะทำให้เสียงเล่นเร็วขึ้นและมีระยะเวลาที่สั้นกว่าเสียงเดิม นั่นคือ เสียงที่ผ่านการปรับเปลี่ยนค่านี้จะมีระยะเวลาที่เร็วกว่าเสียงเดิม แต่ความสูงเสียงจะคงที่และไม่เปลี่ยนแปลงโดยแบ่งออกเป็น 6 set ดังนี้
  • 3.1) +4% Size : 1.4 GB
  • 3.2) +10% Size : 1.4 GB
  • 3.3) +20% Size : 1.4 GB
  • 3.4) -4% Size : 1.4 GB
  • 3.5) -10% Size : 1.4 GB
  • 3.6) -20% Size : 1.4 GB
  • รวม 6 ชุด ขนาดไฟล์รวม 8.4 GB

  • รวมทั้งหมด 13 ชุดข้อมูล ขนาดไฟล์รวม 16 GB

    Speech
    16 GB
    Text-Summarization

    คลังข้อมูลการสรุปข่าวเศรษฐกิจจำนวน 3000 ข่าว มีการสรุปข่าว 2 วิธี ดังนี้ (1) สรุปข่าวด้วยวิธี Extractive และ (2) สรุปข่าวด้วยวิธี Abstractive ข่าวต้นฉบับถูกรวบรวมจากเว็บไซต์ข่าวออนไลน์ เช่น กรุงเทพธุรกิจ, ประชาชาติธุรกิจ, บางกอทูเดย์ ฯลฯ ส่วนผลสรุปที่พัฒนาขึ้นนั้นได้กำหนดผลสรุปให้มีความยาวประมาณ 40% ของความยาวข่าวต้นฉบับ

    Text
    5.53 MB
    Thai OCR

    ฐานข้อมูลภาพสำหรับพัฒนาโปรแกรมรู้จำตัวอักษรภาษาไทย แบ่งเป็น

  • 1) ชุดฝึกฝน (Training set) ประกอบด้วยภาพอักษรภาษาไทยประเภท BMP จำนวน 162 ตัวอักษร แต่ละตัวอักษรมี 5,000 รูปแบบ รวมทั้งสิ้น 810,000 รูปแบบ
  • 2) ชุดทดสอบ (Test set) เป็นเป็นไฟล์ภาพเอกสารภาษาไทยประเภท JPG แบ่งเป็น 2 หมวด คือ หนังสือ และวารสารวิชาการ จำนวนหมวดละ 100 หน้า
  • Image
    309 MB
    Thai Plagiarism

    ชุดข้อมูลเอกสารที่มีการคัดลอก ซึ่งเป็นการจำลองการสร้างข้อความที่มีการคัดลอกด้วยคน โดยใช้บทความวิกิพีเดียภาษาไทยและเว็บเพจเป็นฐานข้อมูล ชุดข้อมูลนี้ประกอบด้วย

  • 1) ชุดเอกสารต้องสงสัยหรือชุดเอกสารที่มีการคัดลอก (Suspicious documents) จำนวน 1,050 ชุด
  • 2) ชุดเอกสารต้นฉบับ (Source documents)
  • โดยชุดเอกสารต้องสงสัยแบ่งการจำลองการคัดลอกออกเป็น 4 ประเภทของการคัดลอกเอกสารภาษาไทย ได้แก่ copy-based change, lexicon-based change, structure-based change และ semantic-based change

    ดูรายละเอียดเพิ่มเติมที่ http://copycatch.in.th/thai-plagiarism-task.html
    Text
    122 MB
    Thai QA

    ชุดข้อมูลที่ประกอบด้วยกลุ่มคู่คำถามและคำตอบที่ถูกสร้างจากผู้ใช้ทั่วไปและเป็นกลุ่มคู่คำถามและคำตอบที่มีเนื้อหาหลากหลาย เช่น ด้านวิทยาศาสตร์ การท่องเที่ยว กีฬา และอื่น ๆ จากวิกิพีเดียภาษาไทย นอกจากนี้คำถามที่อยู่ในกลุ่มนี้เป็นคำถามง่ายและยากผสมกัน โดยจะมีคำแสดงคำถามได้แก่ ใคร อะไร ไหน ที่ไหน เมื่อไร ใด กี่ เท่าไร เท่าใด ชุดข้อมูลมีจำนวนทั้งหมด 4,000 ชุด

    ดูรายละเอียดเพิ่มเติมที่ http://copycatch.in.th/thai-qa-task.html
    Text
    267 KB
    Thai WIKI QA

    คลังข้อมูลที่ใช้ในการแข่งขันพัฒนาโปรแกรมถามตอบจากคลังข้อมูลวิกิพีเดีย ในงาน National Software Contest (NSC) ปี 2561-2562 คลังข้อมูลประกอบด้วย

  • 1) คำถามที่เป็นข้อเท็จจริง (Factoid) จำนวน 15,000 คู่คำถาม
  • 2) คำถามตอบรับหรือปฏิเสธ (Yes/No) จำนวน 2,000 คู่คำถาม
  • 3) คลังข้อมูลวิกิพีเดียภาษาไทยที่ใช้ในการสร้างคู่คำถาม

  • ดูรายละเอียดเพิ่มเติมที่
    http://copycatch.in.th/corpus/thai-wikiqa-nsc2020.html
    Text
    162 MB
    Thai WordNet
    เครือข่ายคำไทย

    This Thai WordNet data set is a comprehensive linguistic resource developed through translation equivalence methods. It includes hierarchically organized sets of Thai synonyms and their semantic relations, facilitating natural language processing and computational linguistics tasks. This resource aims to bridge cultural and linguistic gaps, providing accurate and contextually relevant Thai terms. Ideal for researchers, educators, and developers, this data can enhance language models and applications requiring nuanced understanding of the Thai language. Download the Thai WordNet to access a robust tool for advancing your linguistic projects.

    Text
    16.8 MB
    THAI-NEST

    คลังข้อความข่าวที่มีการกำกับเนมเอนทิตี ได้แก่ ชื่อบุคคล ชื่อสถานที่ ชื่อองค์กร กลุ่มคำบ่งบอกวันที่และเวลา กลุ่มคำบ่งบอกปริมาณ

    Text
    49.8 MB
    TSynC2_Nun

    ฐานข้อมูลเสียงพูดภาษาไทยสำหรับการสังเคราะห์เสียง เวอร์ชั่น 2 สร้างขึ้นเพื่อ

  • 1) ใช้เป็นฐานข้อมูลสำหรับสร้าง acoustic model แบบอัตโนมัติ
  • 2) ใช้เป็นหน่วยเสียงพื้นฐานสำหรับโปรแกรมสังเคราะห์เสียงพูดภาษาไทย
  • คุณสมบัติของฐานข้อมูล

  • - ส่วนข้อมูลข้อความ (text) คัดเลือกประโยคภาษาไทยทั้งหมดจำนวน 2710 ประโยค จากข้อความข่าว ซึ่งแต่ละประโยคได้รับการตัดคำเรียบร้อยแล้ว จัดเก็บในรูปแบบข้อความภาษาไทยที่ตัดคำแล้วพร้อมด้วยข้อความถ่ายถอดเสียงด้วยสัญลักษณ์แทนเสียง (phonetic transcription)
  • - ส่วนข้อมูลเสียง (speech) จำนวน 1 เสียง (ผู้หญิง) อัตราสุ่มสัญญาณ 44.1 kHz ที่ 16 bits/sample ภาวะห้องเงียบ ( Approximate SNR 32.68 dB) ขนาดของชั่วโมงเสียง (speech hour): 5 ชั่วโมง 25 นาที
  • Speech
    1.2 GB
    คลังข้อมูล
    การจำลองประโยค

    คลังข้อความคู่คำถามคำตอบ เกี่ยวกับ Help Desk หรือ IT Support และการจัดซื้อจัดจ้าง โดยประโยคคำถาม มีการจำลองขึ้นมาเพิ่มเติมด้วยการปรับเปลี่ยนองค์ประกอบของประโยค เพื่อสร้างความหลากหลายให้กับรูปประโยค ด้วยวิธี Easy Data Augmentation (EDA) ได้แก่ 1) Insert 2) delete 3) replace และ 4) swap

    Text
    21 KB
    คลังข้อมูล
    ประเภทคำถาม

    คลังข้อความคำถามซึ่งรวบรวมจากเว็บไซต์ที่เผยแพร่เป็นสาธารณะ มีการกำกับเป็นประเภท ดังนี้

  • 1) not_question2) not_complete
  • 3) complex4) what
  • 5) where6) when
  • 7) why8) which
  • 9) who10) how
  • 11) how_manyและ 12) yes_no
  • นอกจากนี้ ยังมีประเภทพิเศษ ซึ่งขึ้นอยู่กับบริบท ได้แก่

  • 1) what_subj2) when_subj
  • 3) which_subj4) who_subj
  • 5) how_many_subj6) yes_no_subj
  • Text
    1.51 MB
    |

    Welcome

    Log in to your account to continue

    Forgot password

    No account yet? Sign up now

    Registration

    Forgot Your Password

    User Agreement

    • AI for Thai เป็นบริการสาธารณะแก่ที่ผู้สนใจทดสอบใช้ผลงานวิจัยและพัฒนาของคนไทยเพื่อคนไทย เพื่อศึกษาหรือทดลอง
    • AI for Thai สงวนสิทธิ์ในการพัฒนาหรือปรับปรุงรูปแบบและลักษณะของบริการ รวมทั้งการปรับปรุงหรือแก้ไขเว็บไซต์หรือเนื้อหาบนเว็บไซต์นี้ โดยไม่ต้องแจ้งให้ผู้ใช้บริการทราบล่วงหน้า
    • ผู้ใช้บริการยินยอมส่งข้อมูลหรือแสดงข้อมูล เช่น ไฟล์ข้อมูล ข้อความ บทความ รูปภาพ วีดิทัศน์ เสียง กราฟฟิค เป็นต้น ให้กับผู้ให้บริการเพื่อใช้ประโยชน์ในการวิจัยและพัฒนาต่อไป
    • ผู้ใช้บริการเป็นผู้รับผิดชอบการได้มาซึ่งลิขสิทธิ์ของข้อมูลที่นำเข้าในระบบบริการต่าง ๆ บนเว็บไซต์ โดย AI for Thai ไม่มีส่วนเกี่ยวข้องหรือรับผิดชอบต่อข้อมูลหรือเนื้อหาที่ผู้ใช้บริการนำเข้าสู่ระบบ
    • เนื้อหาที่นำเสนอต่อผู้ใช้บริการ อาจได้รับการคุ้มครองสิทธิในทรัพย์สินทางปัญญาของเจ้าของเนื้อหานั้น ผู้ใช้บริการไม่มีสิทธิเปลี่ยนแปลงแก้ไข จำหน่ายจ่ายโอนหรือสร้างผลงานต่อเนื่องโดยอาศัยเนื้อหาดังกล่าวไม่ว่าจะทั้งหมดหรือบางส่วน เว้นแต่ผู้ใช้บริการจะได้รับอนุญาตโดยชัดแจ้งจากเจ้าของเนื้อหานั้น
    • AI for Thai อาจหยุดให้บริการเป็นการชั่วคราวหรือถาวร หรือยกเลิกการให้บริการแก่ผู้ใช้บริการรายใด รวมทั้งปฏิเสธหรือจำกัดการเข้าถึงเว็บไซต์นี้จากหมายเลขไอพี (IP Address) ใด โดยไม่จำเป็นต้องบอกกล่าวหรือระบุเหตุผลในการดำเนินการนั้น หากการให้บริการดังกล่าวส่งผลกระทบต่อผู้ใช้บริการอื่น ๆ หรือขัดต่อกฎหมาย
    • การหยุดหรือการยกเลิกบริการตามข้อ 6 ผู้ใช้บริการจะไม่สามารถเข้าใช้บริการ และเข้าถึงรายละเอียดบัญชีของผู้ใช้บริการ ไฟล์เอกสารใด ๆ หรือเนื้อหาอื่น ๆ ที่อยู่ในบัญชีของผู้ใช้บริการได้
    • ในกรณีที่ AI for Thai หยุดให้บริการเป็นการถาวร หรือยกเลิกบริการแก่ผู้ใช้บริการ AI for Thai มีสิทธิในการลบข้อมูลต่าง ๆ ที่อยู่ในบัญชีของผู้ใช้บริการได้โดยไม่ต้องแจ้งให้ผู้ใช้บริการทราบล่วงหน้า

    • ผู้ใช้บริการจะให้ข้อมูลเกี่ยวกับตนเอง เช่น ข้อมูลระบุตัวตนหรือรายละเอียดการติดต่อที่ถูกต้อง เป็นจริง และเป็นปัจจุบันเสมอแก่ AI for Thai อันเป็นส่วนหนึ่งของกระบวนการลงทะเบียนใช้บริการ หรือการใช้บริการที่ต่อเนื่อง
    • ผู้ใช้บริการจะใช้บริการเว็บไซต์นี้ เพื่อวัตถุประสงค์ตามที่ได้รับอนุญาตตามข้อกำหนดของ AI for Thai และไม่ขัดต่อกฎหมาย กฎ ระเบียบ ข้อบังคับ หรือหลักปฏิบัติที่เป็นที่ยอมรับโดยทั่วไป
    • ผู้ใช้บริการจะไม่เข้าใช้หรือพยายามเข้าใช้บริการหนึ่งบริการใดโดย วิธีอื่น รวมถึงการใช้วิธีการอัตโนมัติ (การใช้สคริปต์) นอกจากช่องทางที่ AI for Thai จัดเตรียมไว้ให้ เว้นแต่ผู้ใช้บริการจะได้รับอนุญาตจาก AI for Thai โดยชัดแจ้งให้ทำเช่นนั้นได้
    • ผู้ใช้บริการจะไม่ทำหรือมีส่วนร่วมในการขัดขวาง หรือรบกวนบริการของ AI for Thai รวมทั้งเครื่องแม่ข่ายและเครือข่ายที่เชื่อมต่อกับบริการ
    • ผู้ใช้บริการจะไม่ทำสำเนา คัดลอก ทำซ้ำ ขาย แลกเปลี่ยน ขายต่อบริการ หรือดำเนินการอื่นใดกับเนื้อหาหรือข้อมูลบนเว็บไซต์เพื่อวัตถุประสงค์อื่นนอกเหนือจากที่ได้รับอนุญาตตามข้อกำหนดของ AI for Thai เว้นแต่ผู้ใช้บริการจะได้รับอนุญาตจาก AI for Thai โดยชัดแจ้งให้ทำเช่นนั้นได้
    • ผู้ใช้บริการมีหน้าที่ในการรักษาความลับของรหัสผ่านที่เชื่อมโยงกับบัญชีใด ๆ ที่ใช้ในการเข้าถึงบริการ
    • ผู้ใช้บริการจะเป็นผู้รับผิดชอบแต่เพียงผู้เดียวต่อบุคคลใด ๆ รวมถึง AI for Thai ในความเสียหายอันเกิดจากการละเมิดข้อกำหนด

    • การเชื่อมโยงไปยังเว็บไซต์อื่นเป็นเพียงการให้บริการเพื่ออำนวยความสะดวกแก่ผู้ใช้บริการเท่านั้น AI for Thai มิได้มีส่วนเกี่ยวข้องหรือมีอำนาจควบคุม รับรอง ความถูกต้องความน่าเชื่อถือ ตลอดจนความรับผิดชอบในเนื้อหาข้อมูลของเว็บไซต์นั้น ๆ และ AI for Thai ไม่รับผิดชอบต่อเนื้อหาใด ๆ ที่แสดงบนเว็บไซต์อื่นที่เชื่อมโยงมายังเว็บไซต์ของ AI for Thai หรือต่อความเสียหายใด ๆ ที่เกิดขึ้นจากการใช้บริการเว็บไซต์เหล่านั้น
    • กรณีต้องการเชื่อมโยงมายังเว็บไซต์ของ AI for Thai ผู้ใช้บริการสามารถเชื่อมโยงมายังหน้าแรกของเว็บไซต์ของ AI for Thai ได้ โดยแจ้งความประสงค์เป็นหนังสือ แต่หากต้องการเชื่อมโยงมายังหน้าภายในของเว็บไซต์นี้ จะต้องได้รับความยินยอมเป็นหนังสือจาก AI for Thai แล้วเท่านั้น และในการให้ความยินยอมดังกล่าว AI for Thai ขอสงวนสิทธิ์ที่จะกำหนดเงื่อนไขใด ๆ ไว้ด้วยก็ได้

    • AI for Thai จะไม่รับผิดต่อความเสียหายใด ๆ รวมถึงความเสียหาย สูญเสียและค่าใช้จ่ายที่เกิดขึ้นไม่ว่าโดยตรงหรือโดยอ้อม ที่เป็นผลหรือสืบเนื่องจากการที่ผู้ใช้บริการเข้าใช้เว็บไซต์นี้หรือเว็บไซต์ที่เชื่อมโยงกับเว็บไซต์นี้ หรือต่อความเสียหาย สูญเสียหรือค่าใช้จ่ายที่เกิดจากความล้มเหลวในการใช้งาน ความผิดพลาด การละเว้น การหยุดชะงัก ข้อบกพร่อง ความไม่สมบูรณ์ คอมพิวเตอร์ไวรัส ถึงแม้ว่า AI for Thai จะได้รับแจ้งว่าอาจจะเกิดความเสียหาย สูญเสียหรือค่าใช้จ่ายดังกล่าวขึ้น
    • AI for Thai จะไม่รับผิดต่อผู้ใช้บริการเว็บไซต์หรือบุคคลจากการเรียกร้องใด ๆ ที่เกิดขึ้นจากบนเว็บไซต์ หรือเนื้อหาใด ๆ ซึ่งรวมถึงการตัดสินใจหรือการกระทำใด ๆ ที่เกิดจากความเชื่อถือในเนื้อหาดังกล่าวของผู้ใช้บริการเว็บไซต์ หรือในความเสียหายใด ๆ ไม่ว่าความเสียหายทางตรงหรือทางอ้อม รวมถึงความเสียหายอื่นใดที่อาจเกิดขึ้นได้ ผู้ใช้บริการยอมรับและตระหนักดีว่า AI for Thai จะไม่ต้องรับผิดชอบต่อการกระทำใดของผู้ใช้บริการทั้งสิ้น
    • ข้อมูลที่แสดงในเว็บไซต์นี้เป็นข้อมูลที่ได้มาจากหลายแหล่งและนำเสนอตามสภาพ ที่ได้รับจากแหล่งที่น่าจะเชื่อถือได้ แต่ AI for Thai ไม่อาจรับรองว่าข้อมูลนั้นถูกต้องหรือสมบูรณ์เพื่อการใช้ประโยชน์ใด ๆ ผู้ใช้บริการพึงใช้วิจารณญาณด้วยตนเอง และโปรดทราบว่าบรรดาบทความ ข้อแนะนำ หรือความคิดเห็นใด ๆ ที่แสดงไว้ในเว็บไซต์นี้ยังคงเป็นของผู้นำเสนอข้อมูลดังกล่าว มิได้หมายความว่า AI for Thai จะเห็นพ้องหรือยอมรับบทความ คำแนะนำ หรือความคิดเห็นนั้น เว้นแต่จะมีข้อความแสดงโดยชัดแจ้งไว้เป็นอย่างอื่น

    • AI for Thai จะปฏิบัติต่อข้อมูลส่วนบุคคลอย่างมั่นคงปลอดภัยและปิดเป็นความลับ และปกป้องความเป็นส่วนตัวของผู้ใช้บริการ
    • ผู้ใช้บริการต้องรับผิดชอบต่อข้อมูลส่วนบุคคลต่าง ๆ ที่นำเข้าสู่ระบบบริการของ AI for Thai แต่เพียงผู้เดียว

    • AI for Thai เป็นผู้มีสิทธิตามกฎหมาย แต่เพียงผู้เดียวในกรรมสิทธิ์ สิทธิในทรัพย์สินทางปัญญาใด รวมทั้งผลประโยชน์ทั้งหมดที่มีอยู่ในบริการ ซึ่ง AI for Thai เป็นผู้จัดทำขึ้น ไม่ว่าสิทธิเหล่านั้นจะได้รับการจดทะเบียนไว้หรือไม่ก็ตาม
    • AI for Thai เป็นเจ้าของลิขสิทธิ์ หรือสิทธิในทรัพย์สินทางปัญญาในเนื้อหาต่าง ๆ ที่แสดงบนเว็บไซต์นี้ ซึ่งครอบคลุมถึงไฟล์ข้อมูล ข้อความ บทความ รูปภาพ วีดิทัศน์ เสียง กราฟฟิค หรือโปรแกรมคอมพิวเตอร์ (รวมเรียกว่า “เนื้อหา”) เว้นแต่จะระบุโดยชัดแจ้งไว้เป็นอย่างอื่น โดย AI for Thai มีสิทธิหรือมีอำนาจควบคุมการใช้เนื้อหานั้นห้ามมิให้ทำซ้ำ ดัดแปลง จัดเก็บ ถ่ายโอน ลอกเลียนแบบ เผยแพร่ต่อสาธารณชน หรือกระทำการใด ๆ อันเป็นการละเมิดลิขสิทธิ์หรือสิทธิในทรัพย์สินทางปัญญาโดยไม่ได้รับความยินยอมล่วงหน้าเป็นลายลักษณ์อักษรจาก AI for Thai เว้นแต่การใช้จัดพิมพ์หรือดาวน์โหลดเนื้อหาที่แสดงบนเว็บไซต์เพื่อใช้เป็นการส่วนบุคคล โดยผู้ใช้ต้องไม่ลบข้อความเกี่ยวกับลิขสิทธิ์หรือสิทธิในทรัพย์สินทางปัญญาออกจากเนื้อหานั้น
    • ผู้ใช้บริการจะต้องไม่ใช้ชื่อทางการค้า เครื่องหมายการค้า เครื่องหมายบริการ ตราสัญลักษณ์ ชื่อโดเมนของ AI for Thai โดยไม่ได้รับความยินยอมล่วงหน้าเป็นลายลักษณ์อักษรจาก AI for Thai

    • การตีความ และการบังคับตามข้อกำหนดการให้บริการฉบับนี้ ให้เป็นไปตามกฎหมายไทย
    • กรณีที่เกิดความเสียหายแก่ AI for Thai อันเนื่องมาจากการดำเนินคดี การบังคับใช้สิทธิเรียกร้อง การชดใช้ค่าเสียหายจากความรับผิดหรือค่าใช้จ่ายใด ๆ (รวมถึงค่าทนายความ) ที่เกิดขึ้นสืบเนื่องจากการใช้เว็บไซต์ของผู้ใช้บริการ ผู้ใช้บริการรับจะชดใช้ความเสียหายดังกล่าวให้แก่ AI for Thai ทั้งสิ้น ไม่ว่ากรณีดังกล่าวจะเกิดจากการที่ผู้ใช้บริการไม่ปฏิบัติตามข้อกำหนดการให้บริการนี้หรือไม่

    FAQs (คำถามที่ถามบ่อย)

    Q1: AI for Thai สามารถใช้งานได้ฟรี หรือ มีค่าใช้จ่ายอย่างไร ?
    สามารถใช้งานได้ฟรี เพื่อการศึกษาหรือทดสอบการใช้งานเท่านั้น ห้ามใช้ในเชิงพาณิชย์ และ มีการจำกัดการเรียกใช้ (Free limited services) โดยจำนวนการเรียกใช้จะถูกจำกัดเป็น 3 ระดับ ได้แก่ จำนวนการเรียกใช้ของแต่ละผู้ใช้ ต่อนาที / ต่อวัน / ต่อเดือน และ อีกส่วนคือจำนวนการเรียกใช้ทั้งหมดของระบบ ต่อวินาที ซึ่งตัวเลขอาจมีการปรับเปลี่ยนเพื่อความเหมาะสมโดยไม่แจ้งล่วงหน้า โดยจะขึ้นอยู่กับทรัพยากรและความนิยมในการใช้งาน นักพัฒนาสามารถดูรายละเอียดเพิ่มเติมในส่วนของ Developers -> How to get started (ต้องล็อกอินเข้าใช้ระบบ)
    Q2: AI for Thai เหมาะสำหรับใครในการใช้งาน ?
    เหมาะสำหรับนักพัฒนาซอฟต์แวร์ที่ต้องการใช้งานในส่วนของความสามารถ AI ที่เกี่ยวข้องกับภาษาไทย หรือ บริการที่เกี่ยวข้องกับความเป็นไทย (อาหารไทย สถานที่ท่องเที่ยว เป็นต้น) โดยเปิดให้ใช้ในปริมาณที่น่าจะเพียงพอต่อการทดสอบ prototype ให้มีความพร้อมก่อนเริ่มธุรกิจ (ช่วยลดต้นทุนในการเริ่มต้นธุรกิจ) ทั้งนี้รวมถึงผู้สนใจที่อยากทดสอบความสามารถของ AI สัญชาติไทย หรือ ใช้ในการเรียนการสอนทั่วไป
    Q3: AI for Thai เปิดรับบริการจากภายนอกหรือไม่ เจ้าของผลิตภัณฑ์ที่เกี่ยวกับ AI สามารถนำบริการต่าง ๆ มาวางได้หรือไม่ ?
    AI for Thai เปิดรับบริการ AI ที่เกี่ยวข้องทั้งจาก สถาบันการศึกษา สถาบันวิจัย สมาคม รวมถึงบริษัทเอกชน นักพัฒนาทั่วไป สามารถนำบริการมาวางที่ AI for Thai โดยสามารถติดต่อได้ที่ business@nectec.or.th ทั้งนี้บริการที่จะนำมาวางจะต้องยอมรับเงื่อนไขการให้บริการตามนโยบายของ AI for Thai (free limited services) และ มีองค์ประกอบที่ครบตามรูปแบบบริการอื่น ๆ เช่น API แยกเป็นแต่ละบริการ (ในรูปแบบของ Docker image), มีข้อมูลทดสอบการทำ Load test เบื้องต้น, มีเอกสารคู่มือการใช้งาน API เป็นต้น
    Q4: หากต้องการนำ AI for Thai ไปทำธุรกิจจะมีค่าใช้จ่ายอย่างไร ?
    หลังจากนักพัฒนาทำการทดสอบใช้งานในการสร้าง Prototype ของผลิตภัณฑ์เป็นที่น่าพอใจแล้ว และเมื่อต้องการใช้งานในเชิงธุรกิจ สามารถติดต่อสอบถามรายละเอียดได้ที่ business@nectec.or.th โดยระบุผลงานและลักษณะของธุรกิจที่สนใจนำไปต่อยอด

    นโยบายคุ้มครองข้อมูลส่วนบุคคล
    สำหรับผู้ใช้งานเว็บไซต์ "aiforthai.in.th"

    สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.) โดย ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) มุ่งมั่นที่จะคุ้มครองข้อมูลส่วนบุคคลของผู้ใช้งานเว็บไซต์ "aiforthai.in.th" ภายใต้ข้อกำหนดและเงื่อนไขการใช้บริการเว็บไซต์ นโยบายคุ้มครองข้อมูลส่วนบุคคลนี้จะแจ้งให้ผู้ใช้งานทราบเกี่ยวกับการเก็บรวบรวม ใช้ หรือเปิดเผยข้อมูลส่วนบุคคลของผู้ใช้งาน ผ่านเว็บไซต์ โปรดอ่านและทำความเข้าใจนโยบายคุ้มครองข้อมูลส่วนบุคคลนี้อย่างละเอียด การที่ผู้ใช้งานได้เข้าใช้งานเว็บไซต์นี้แล้ว ถือว่าผู้ใช้งานตกลงยอมรับข้อกำหนดที่ระบุในนโยบายคุ้มครองข้อมูลส่วนบุคคลนี้แล้วทุกประการ หากผู้ใช้งานไม่สามารถยอมรับข้อกำหนดนโยบายคุ้มครองข้อมูลส่วนบุคคลนี้ได้ ขอให้ผู้ใช้งานปฏิเสธการใช้งานเว็บไซต์ทันที

    "เรา" หมายถึง สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.) โดย ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) ซึ่งเป็นผู้พัฒนาเว็บไซต์ aiforthai.in.th

    "ผู้ใช้งาน" หมายถึง บุคคลธรรมดาที่เข้าใช้งานเว็บไซต์ ไม่ว่าจะได้มีการลงทะเบียนผ่านทางเว็บไซต์หรือไม่

    "อุปกรณ์" หมายถึง โทรศัพท์เคลื่อนที่ คอมพิวเตอร์ แท็บเล็ต หรืออุปกรณ์อื่นซึ่งผู้ใช้งานสามารถใช้ในการเข้าถึงการใช้งานเว็บไซต์ได้

    "ข้อมูลส่วนบุคคล" หมายถึง ข้อมูลใด ๆ เกี่ยวกับสิ่งเฉพาะตัวของผู้ใช้งาน เช่น ชื่อ นามสกุล ชื่อวารสาร ที่อยู่อีเมล หมายเลขโทรศัพท์ เลขประจำตัวผู้เสียภาษี ชื่อหน่วยงาน ที่อยู่หน่วยงาน เป็นต้น

    "เว็บไซต์" หมายถึง เว็บไซต์ aiforthai.in.th

    2.1 เรารวบรวมข้อมูลส่วนบุคคลและข้อมูลส่วนบุคคลอ่อนไหวของผู้ใช้งานที่ผู้ใช้งานให้กับเราโดยตรง ตราบเท่าที่ผู้ใช้งานอนุญาตโดยชัดแจ้งหรือโดยนัยให้เราใช้ประมวลผลและเก็บรักษาข้อมูลดังกล่าวผ่านทางเว็บไซต์ (ถ้ามี)

    2.2 เรารวบรวมข้อมูลส่วนบุคคลและข้อมูลส่วนบุคคลอ่อนไหวของผู้ใช้งานจากบุคคลที่สาม ตราบเท่าที่บุคคลที่สามดังกล่าวได้รับอนุญาตโดยชัดแจ้งหรือโดยนัยให้เราใช้ประมวลผลและเก็บรักษาข้อมูลดังกล่าวผ่านทางเว็บไซต์ โดยเราเชื่อโดยสุจริตว่าบุคคลที่สามดังกล่าวมีสิทธิเก็บข้อมูลส่วนบุคคลและข้อมูลส่วนบุคคลอ่อนไหวของผู้ใช้งานและเปิดเผยกับเรา (ถ้ามี)

    จากแหล่งข้อมูลข้างต้น ข้อมูลที่เราจะเก็บรวบรวมมีดังนี้

    3.1 ข้อมูลส่วนบุคคล ได้แก่ ชื่อ นามสกุล ชื่อผู้ใช้ (User name) รหัสผ่าน (Password) กุญแจส่วนตัว (Private Key) ชื่อหน่วยงาน ที่อยู่หน่วยงาน ข้อมูลการติดต่อ เช่น ที่อยู่อีเมล (email address) หมายเลขโทรศัพท์ รวมถึงข้อมูลส่วนบุคลอื่น ๆ ตามที่ผู้ใช้งานให้ไว้กับเราและเป็นข้อมูลส่วนบุคคลที่ถูกต้อง ครบถ้วน เป็นปัจจุบัน และไม่ก่อให้เกิดการเข้าใจผิด เช่น ข้อมูลการศึกษา

    3.2 ข้อมูลส่วนบุคคลอ่อนไหว ได้แก่ ข้อมูลที่เป็นเรื่องส่วนบุคคลโดยแท้ของบุคคล แต่มีความละเอียดอ่อนและอาจสุ่มเสี่ยงในการเลือกปฏิบัติอย่างไม่เป็นธรรม เช่น เชื้อชาติ เผ่าพันธุ์ ความคิดเห็นทางการเมือง ความเชื่อในลัทธิ ศาสนาหรือปรัชญา พฤติกรรมทางเพศ ประวัติอาชญากรรม ข้อมูลสุขภาพ ความพิการ ข้อมูลสหภาพแรงงาน ข้อมูลพันธุกรรม ข้อมูลชีวภาพ หรือข้อมูลอื่นใด ซึ่งกระทบต่อเจ้าของข้อมูลส่วนบุคคลในทำนองเดียวกันตามที่คณะกรรมการคุ้มครองข้อมูลส่วนบุคคลประกาศกำหนด ทั้งนี้ ผู้ใช้งานสามารถถอนความยินยอมได้ทุกเมื่อและเราจะไม่ประมวลผลข้อมูลส่วนบุคคลอ่อนไหวใด ๆ ที่ผู้ใช้งานไม่ได้ให้ความยินยอมหรือไม่ได้แจ้งไว้กับเรา

    3.3 ข้อมูลอื่น ๆ ที่ไม่ถือเป็นข้อมูลส่วนบุคคล เนื่องจากไม่สามารถระบุตัวตนของผู้ใช้งานได้ไม่ว่าโดยตรงหรือโดยอ้อม เช่น ข้อมูลทางสถิติ ข้อมูลอาหาร ข้อมูลยาที่รับประทาน อย่างไรก็ตามหากเรารวมหรือเชื่อมโยงข้อมูลอื่น ๆ ที่ไม่ถือเป็นข้อมูลส่วนบุคคลนี้กับข้อมูลส่วนบุคคลอื่น ๆ ของผู้ใช้งานเพื่อให้สามารถระบุตัวตนของผู้ใช้งานได้ไม่ว่าโดยทางตรงหรือทางอ้อม ถือว่าข้อมูลอื่น ๆ นี้เป็นข้อมูลส่วนบุคคลประเภทหนึ่งที่อยู่ภายใต้นโยบายคุ้มครองข้อมูลส่วนบุคคลนี้

    โดยที่ข้อมูลส่วนบุคคล ข้อ 3.1 ข้อมูลส่วนบุคคล ข้อ 3.2 ข้อมูลส่วนบุคคลอ่อนไหว และข้อมูลอื่น ๆ ข้อ 3.3 ในนโยบายคุ้มครองข้อมูลส่วนบุคคลนี้รวมเรียกว่า "ข้อมูลส่วนบุคคล"

    เราเก็บรวมรวมข้อมูลส่วนบุคคลของผู้ใช้งานเพื่อนำไปใช้ภายใต้วัตถุประสงค์ของการใช้งานเว็บไซต์ ดังนี้

    4.1 ติดต่อและประสานงานกับผู้ใช้งานในการให้บริการเว็บไซต์ ได้แก่ การออกหนังสือเชิญอบรม การประชาสัมพันธ์ข่าวสาร กิจกรรมที่เกี่ยวข้องกับเว็บไซต์ การตอบคำถาม เป็นต้น

    4.2 ควบคุมการใช้งาน เนื้อหาของวาสาร ให้เป็นไปตามจริยธรรมการใช้งาน

    4.3 ร้องขอข้อมูลบางส่วนจากผู้ใช้งานเพื่อตรวจสอบหรือระบุตัวตนก่อนจะดำเนินการใด ๆ ตามที่ผู้ใช้งานร้องขอ

    4.4 ข้อมูลส่วนบุคคลที่ได้รับจากการลงทะเบียนในเว็บไซต์ เพื่อนำไปประกอบการลงทะเบียนและการใช้บริการระบบ เป็นต้น

    5.1 การเก็บรวบรวมข้อมูลส่วนบุคคล เราจะเก็บรวบรวมข้อมูลของผู้ใช้งานจากแหล่งที่มาของข้อมูลส่วนบุคคลข้างต้นอย่างจำกัดและเท่าที่จำเป็น โดยขึ้นอยู่กับวัตถุประสงค์ในการประมวลผลข้อมูลตามนโยบายคุ้มครองข้อมูลส่วนบุคคลนี้

    5.2 การใช้ข้อมูลส่วนบุคคล เราจะใช้หรือเปิดเผยข้อมูลส่วนบุคคลของผู้ใช้งานตามวัตถุประสงค์ที่ผู้ใช้งานให้ไว้กับเรา โดยข้อมูลส่วนบุคคลของผู้ใช้งานจะถูกนำไปใช้เท่าที่จำเป็น โดยมีมาตรการการรักษาความมั่นคงปลอดภัยและมีการควบคุมการเข้าถึงข้อมูล และหากมีการแก้ไขเปลี่ยนแปลงวัตถุประสงค์ เราจะแจ้งให้ผู้ใช้งานทราบ และจะปฏิบัติให้เป็นไปตามกฎหมายคุ้มครองข้อมูลส่วนบุคคล

    5.3 การเปิดเผยข้อมูลส่วนบุคคล โดยปกติเราจะไม่เปิดเผยข้อมูลส่วนบุคคล เว้นแต่เป็นการเปิดเผยตามวัตถุประสงค์ที่ผู้ใช้งานได้ให้ไว้กับเรา หรือเป็นไปตามภาระผูกพันตามสัญญา หรือตามที่กฎหมายกำหนดให้เปิดเผย และในกรณีใด ๆ ที่เราต้องการเก็บรวมรวม ใช้ หรือเปิดเผยข้อมูลส่วนบุคคลเพิ่มเติมหรือมีการเปลี่ยนแปลงวัตถุประสงค์ในการเก็บรวบรวม ใช้ หรือเปิดเผย เราจะแจ้งให้ผู้ใช้งานทราบก่อนที่จะดำเนินการกับข้อมูลส่วนบุคคลนั้น เว้นแต่เป็นกรณีที่กฎหมายกำหนดหรืออนุญาตให้ดำเนินการได้

    เราจะเก็บรักษาข้อมูลส่วนบุคคลตราบเท่าที่จำเป็นต่อการประมวลผล หรือตราบเท่าที่บัญชีของผู้ใช้งานยังไม่ถูกปิดใช้งาน บัญชีจะได้รับการพิจารณาว่า "ปิดใช้งาน" หากผู้ใช้งานได้ดำเนินการยกเลิกบัญชีของผู้ใช้งานด้วยตนเองหรือขอให้เรายกเลิกบัญชีของผู้ใช้งานโดยส่งอีเมลถึงเราที่ business@nectec.or.th

    กรณีที่ผู้ใช้งานดำเนินการยกเลิกบัญชีของผู้ใช้งานด้วยตนเอง เรายังคงเก็บข้อมูลส่วนบุคคลของผู้ใช้งานไว้เป็นระยะเวลา 1 ปี หากพ้นระยะเวลาดังกล่าว เราจะดำเนินการลบข้อมูลของผู้ใช้งานดังกล่าว

    ผู้ใช้งานมีสิทธิในการเข้าถึง ตรวจสอบ แก้ไข ลบ ระงับการใช้ โอนย้ายข้อมูลส่วนบุคคลของผู้ใช้งาน หรือคัดค้านการประมวลผลข้อมูลส่วนบุคคลของผู้ใช้งาน หรือเพิกถอนความยินยอมในการประมวลผลข้อมูลส่วนบุคคลที่ผู้ใช้งานได้ให้ความยินยอมไว้ หากผู้ใช้งานต้องการดำเนินการตามสิทธิดังกล่าว ผู้ใช้งานสามารถดำเนินการด้วยตนเองในเว็บไซต์หรือส่งอีเมลถึงเราที่ business@nectec.or.th โดยเราอาจจะร้องขอข้อมูลบางส่วนจากผู้ใช้งานเพื่อตรวจสอบหรือระบุตัวตนก่อนจะดำเนินการใด ๆ

    เราเคารพการตัดสินใจการเพิกถอนความยินยอมของผู้ใช้งาน แต่อย่างไรก็ตาม เราขอแจ้งให้ผู้ใช้งานทราบว่าอาจมีข้อจำกัดสิทธิในการเพิกถอนความยินยอมโดยกฎหมายหรือข้อกำหนดและเงื่อนไขที่ให้ประโยชน์แก่ผู้ใช้งาน ทั้งนี้ การเพิกถอนความยินยอมย่อมไม่ส่งผลกระทบต่อการเก็บรวบรวม ใช้ หรือเปิดเผยข้อมูล ส่วนบุคคลที่ผู้ใช้งานได้ให้ความยินยอมไว้แล้ว

    ความปลอดภัยของข้อมูลส่วนบุคคลของผู้ใช้งานเป็นสิ่งสำคัญสำหรับเรา เราใช้มาตรการทางเทคนิคเพื่อป้องกันการเข้าถึง การใช้ การเปลี่ยนแปลงแก้ไข หรือการเปิดเผยข้อมูลส่วนบุคคลโดยปราศจากอำนาจหรือโดยไม่ชอบ อย่างไรก็ตาม ไม่มีการรับประกันการส่งข้อมูลผ่านอินเทอร์เน็ตหรือวิธีการจัดเก็บข้อมูลอิเล็กทรอนิกส์มีความปลอดภัย 100% ดังนั้น ในขณะที่เราดำเนินการตามสมควรเพื่อคุ้มครองข้อมูลส่วนบุคคลของผู้ใช้งาน เราไม่สามารถรับประกันความปลอดภัยที่สมบูรณ์ได้ ผู้ใช้งานใช้บริการและให้ข้อมูลส่วนบุคคลกับเราโดยยอมรับความเสี่ยง ผู้ใช้งานต้องป้องกันการเข้าถึงบัญชีและข้อมูลส่วนบุคคลโดยไม่ได้รับอนุญาต โดยการใช้และปกป้องรหัสผ่านอุปกรณ์ของผู้ใช้งานอย่างเหมาะสมและจำกัดการเข้าถึงอุปกรณ์ของผู้ใช้งาน เราขอแนะนำให้ผู้ใช้งานเปลี่ยนรหัสผ่านอุปกรณ์ของผู้ใช้งานเป็นระยะ ผู้ใช้งานมีหน้าที่รักษาความปลอดภัยของชื่อผู้ใช้และรหัสผ่านบัญชีของผู้ใช้งาน หากผู้ใช้งานมีเหตุผลที่เชื่อได้ว่าการมีปฏิสัมพันธ์กับเราจะไม่ปลอดภัยอีกต่อไป (ตัวอย่างเช่น หากผู้ใช้งานรู้สึกว่าความปลอดภัยของบัญชีของผู้ใช้งานถูกบุกรุก) ผู้ใช้งานต้องแจ้งให้เราทราบถึงปัญหาและเปลี่ยนรหัสผ่านทันที

    เราอาจปรับปรุงหรือแก้ไขนโยบายคุ้มครองข้อมูลส่วนบุคคลนี้ได้ในทุกเวลา โดยไม่แจ้งให้ผู้ใช้งานทราบล่วงหน้า การใช้ข้อมูลที่เรารวบรวมนั้นอยู่ภายใต้นโยบายคุ้มครองข้อมูลส่วนบุคคลที่มีผลบังคับใช้ในเวลาที่มีการรวบรวมข้อมูลดังกล่าว ดังนั้น ผู้ใช้งานควรทบทวนหน้านี้เป็นระยะ เพื่อทำความเข้าใจกับนโยบายคุ้มครองข้อมูลส่วนบุคคลฉบับล่าสุด และเพื่อความเหมาะสมและมีประสิทธิภาพในการให้บริการ การที่ผู้ใช้งานยังคงใช้บริการเว็บไซต์ต่อไปภายหลังจากที่มีการประกาศแก้ไขเปลี่ยนแปลงดังกล่าว ให้ถือว่าผู้ใช้งานรับทราบและแสดงเจตนาตกลงยอมรับข้อกำหนดนโยบายคุ้มครองข้อมูลส่วนบุคคลตามการแก้ไขเปลี่ยนแปลงนั้นแล้ว โดยผู้ใช้งานสามารถทราบได้ว่าเมื่อใดที่นโยบายนี้ได้รับการแก้ไขครั้งล่าสุดโดยการตรวจสอบคำว่า "แก้ไขครั้งล่าสุด" ที่ด้านล่างของนโยบายคุ้มครองข้อมูลส่วนบุคคลนี้

    หากผู้ใช้งานมีข้อสงสัยหรือข้อเสนอแนะหรือข้อร้องเรียนเกี่ยวกับนโยบายคุ้มครองข้อมูลส่วนบุคคลหรือการปฏิบัติตามนโยบายคุ้มครองข้อมูลส่วนบุคคลนี้ รวมถึงการแจ้งเกี่ยวกับปัญหาการใช้งานเว็บไซต์ เรายินดีตอบข้อสงสัยและรับฟังข้อเสนอแนะ และเราปฏิบัติต่อข้อร้องเรียนทั้งหมดเกี่ยวกับการคุ้มครองข้อมูลส่วนบุคคลอย่างจริงจัง เราจะตรวจสอบการร้องเรียนของผู้ใช้งานและตอบกลับผู้ใช้งานภายในเวลาอันสมควร ในกรณีที่เราติดต่อกลับล่าช้าเพราะปัจจัยใด ๆ เราจะทำการแจ้งให้ผู้ใช้งานทราบเป็นระยะ ๆ เราอาจจะร้องขอข้อมูลบางส่วนจากผู้ใช้งานเพื่อตรวจสอบหรือระบุตัวตนก่อนจะดำเนินการใด ๆ โดยผู้ใช้งานสามารถติดต่อเราโดยส่งอีเมลถึงเราที่ : business@nectec.or.th หรือตามที่อยู่ด้านล่างนี้

    งานยกระดับความพร้อมทางเทคโนโลยี (LTSS)
    ฝ่ายสนับสนุนบริการทางวิศวกรรมและเทคโนโลยี (TSS)
    ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (ศอ.)
    สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
    112 อุทยานวิทยาศาสตร์ประเทศไทย ถนนพหลโยธิน
    ตำบลคลองหนึ่ง อำเภอคลองหลวง จังหวัดปทุมธานี 12120

    LST20 Corpus
    (AGREEMENT OF USAGE)

    1. การใช้งานที่ไม่ใช่เชิงพาณิชย์ การใช้ในงานวิจัย และโครงการที่เปิดซอร์สโค้ด
    ผู้ใช้สามารถนำคลังข้อมูลนี้ไปใช้ในการใช้งานที่ไม่ใช่พาณิชย์ การวิจัย และโครงการที่เปิดซอร์สโค้ด ได้โดยไม่คิดมูลค่า อย่างไรก็ตามหากท่านใช้คลังข้อมูลนี้ โปรดอ้างอิงรายงานเชิงเทคนิคของเราเพื่อเป็นข้อมูลบรรณานุกรมต่อไป
    หากท่านต้องการเก็บรักษาโมเดลที่เทรนบนคลังข้อมูลชุดนี้ และเผยแพร่กับชุมชนวิจัยในประเทศไทย โปรดส่งโมเดล โค้ด และ APIs มายังโครงการ AI for Thai ได้ โดยติดต่อ ดร. เทพชัย ทรัพย์นิธิ ผ่านทางอีเมล์ thepchai@nectec.or.th
    ทั้งนี้ห้ามผู้ใช้ทำซ้ำหรือแก้ไขส่วนหนึ่งส่วนใดของคลังข้อมูลชุดนี้ นอกจากจะได้รับอนุญาตจากเจ้าของข้อมูล
    2. การใช้งานคลังข้อมูลในเชิงพาณิชย์
    ในการที่จะใช้งานคลังข้อมูลนี้ในเชิงพาณิชย์ ผู้ใช้จะต้องเลือกทำตามเงื่อนไขหนึ่งในสองข้อต่อไปนี้
    • ทางเลือกที่ 1: ผู้ใช้เลือกที่จะสร้างคลังข้อมูลขนาด 50,000 คำ ซึ่งกำกับข้อมูลทางภาษาศาสตร์ให้ครบถ้วนตามคู่มือการกำกับข้อมูลที่แนบมา แล้วนำมาเผยแพร่ในชุมชนวิจัยในประเทศไทย โดยผู้ใช้จะได้รับการยกย่องในฐานะของผู้ร่วมสร้างคลังข้อมูลด้วย
    • ทางเลือกที่ 2: ผู้ใช้เลือกที่ซื้อไลเซนส์สำหรับสิทธิ์ในการใช้คลังข้อมูลนี้ โดยมีระยะเวลาการใช้งานตลอดชีวิต ทั้งนี้สิทธิ์การใช้งานจะครอบคลุมเฉพาะคลังข้อมูลนี้เท่านั้น
    ทั้งนี้โปรดติดต่อ ดร. เทพชัย ทรัพย์นิธิ ผ่านทางอีเมล์ thepchai@nectec.or.th เพื่อรับทราบข้อมูลเพิ่มเติม
    ALL LINGUISTIC DATABASES ARE PROVIDED “AS IS” AND NEITHER LANGUAGE AND SEMANTIC TECHNOLOGY LABORATORY UNDER NATIONAL ELECTRONICS AND COMPUTER TECHNOLOGY CENTER (NECTEC), THAILAND, NOR ITS CORPUS AUTHORS WARRANT THE ACCURACY, COMPLETENESS, CURRENTNESS, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE OF THE LINGUISTIC DATABASES. IN NO EVENT WILL LANGUAGE AND SEMANTIC TECHNOLOGY LABORATORY UNDER NATIONAL ELECTRONICS AND COMPUTER TECHNOLOGY CENTER (NECTEC), THAILAND, AND ITS CORPUS AUTHORS BE LIABLE FOR ANY LOSS OR INJURY CAUSED IN WHOLE OR IN PART BY ITS NEGLIGENCE OR CONTINGENCIES BEYOND ITS CONTROL IN PROCURING, COMPILING, INTERPRETING, EDITING, WRITING, REPORTING OR DELIVERING THE LINGUISTIC DATABASES, OR FOR ANY ERRORS, OMISSIONS OR INACCURACIES IN THE LINGUISTIC DATABASES, REGARDLESS OF HOW CAUSED. IN NO EVENT WILL LANGUAGE AND SEMANTIC TECHNOLOGY LABORATORY UNDER NATIONAL ELECTRONICS AND COMPUTER TECHNOLOGY CENTER (NECTEC), THAILAND, AND ITS CORPUS AUTHORS BE LIABLE TO USER, USER’S RESEARCH GROUP, OR TO ANY OTHER INDIVIDUAL OR ORGANIZATION FOR ANY DECISION MADE OR ACTION TAKEN IN RELIANCE UPON ANY PART OF THE LINGUISTIC DATABASES OR FOR ANY CONSEQUENTIAL, DIRECT, SPECIAL OR SIMILAR DAMAGES, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGES.