
Pantisa Pavabutr, Ph.D. , Wasin Siwasarit, Ph.D.
โครงการนี้มีเป้าหมายเพื่อยกระดับโครงสร้างพื้นฐานด้านข้อมูลตลาดทุนของไทย ผ่านการพัฒนาและจัดทำฐานข้อมูล Market Microstructure ที่พร้อมใช้งานจากข้อมูลธุรกรรมระหว่างวันของตลาดหลักทรัพย์แห่งประเทศไทย ซึ่งเป็นข้อมูลที่มีความถี่สูง มีขนาดใหญ่ และสะท้อนพฤติกรรมการซื้อขายในระดับจุลภาคของตลาดทุน
โครงการตั้งอยู่บนกรอบการวิเคราะห์ข้อมูล Market Microstructure ซึ่งอธิบายพฤติกรรมราคา ปริมาณซื้อขาย สภาพคล่อง และความผันผวนของตลาด อันเกิดจากโครงสร้างการซื้อขาย กลไกคำสั่ง และพฤติกรรมนักลงทุนประเภทต่าง ๆ ข้อมูลระดับจุลภาคเหล่านี้มีศักยภาพสูงในการอธิบายความไม่มีประสิทธิภาพของตลาด (Market Inefficiency) ความไม่สมมาตรของข้อมูล (Information Asymmetry) และพฤติกรรมเชิงพฤติกรรมการเงิน (Behavioral Bias) อย่างไรก็ตาม ข้อมูลดังกล่าวมีความถี่สูง ขนาดใหญ่ และซับซ้อน ทำให้การนำมาใช้จริงในงานวิจัยยังอยู่ในวงจำกัด
โครงการจึงมุ่งจัดทำ Market Microstructure Library ที่พร้อมใช้งาน โดยประมวลผลข้อมูลดิบจาก SET ให้เป็นชุดข้อมูลสรุปจากช่วงการซื้อขายเวลา 30 นาที ครอบคลุมหุ้นในกลุ่ม SET100 ระหว่างปี 2018–2022 พร้อมคำนวณตัวชี้วัดสำคัญ เช่น ราคาเฉลี่ย ค่าสูงสุด–ต่ำสุด ปริมาณและมูลค่าการซื้อขาย สภาพคล่อง ความผันผวน ผลตอบแทนระหว่างวัน รวมถึงการแยกพฤติกรรมการซื้อขายตามประเภทนักลงทุน (ต่างชาติ สถาบัน รายย่อย) ทั้งจากข้อมูล Deal Files และ Order Files ซึ่งช่วยลดภาระด้านการจัดการข้อมูลความถี่สูง และลดความเสี่ยงจากการใช้ข้อมูลดิบโดยตรง
นอกจากฐานข้อมูล โครงการยังจัดทำ คู่มือจำนวน 3 เล่ม และสื่อการเรียนรู้ในรูปแบบอิเล็กทรอนิกส์ (E-learning) เพื่อเชื่อมโยงทฤษฎีกับการประยุกต์ใช้จริง ครอบคลุมตั้งแต่โครงสร้างตลาด กลไกการซื้อขาย การวัดสภาพคล่อง การวิเคราะห์ความผันผวน การศึกษาพฤติกรรมนักลงทุน ไปจนถึงตัวอย่างการประมวลผลข้อมูลและการสร้างภาพข้อมูลด้วยเครื่องมือเชิงโปรแกรม (เช่น SAS และ Python)
ผลลัพธ์ของโครงการช่วยเพิ่มผลิตภาพงานวิจัยด้านตลาดทุนของไทย เปิดโอกาสให้นักวิจัยและนักศึกษาสามารถมุ่งเน้นการตั้งคำถามวิจัยและการวิเคราะห์เชิงลึกได้มากขึ้น ขณะเดียวกัน ตลาดหลักทรัพย์และหน่วยงานกำกับดูแลสามารถนำข้อมูลและองค์ความรู้จากโครงการไปใช้ประกอบการออกแบบนโยบาย การติดตามสภาพคล่อง และการบริหารความผันผวนของตลาดในอนาคต
สำหรับผู้สนใจ ผลลัพธ์ของโครงการนี้สามารถนำไปต่อยอดได้หลากหลาย ทั้งงานวิจัยด้าน Market Microstructure, High-frequency Trading (HFT), Behavioral Finance, Event Study, การสร้างแบบจำลองความผันผวนระหว่างวัน รวมถึงการพัฒนาเครื่องมือวิเคราะห์เพื่อเข้าถึงข้อมูลตลาดทุนได้โดยสะดวกยิ่งขึ้น
สามารถดาวน์โหลดเอกสารของโครงการโดยคลิกด้านล่างนี้ ซึ่งประกอบไปด้วย
The Stock Exchange of Thailand: Intraday Data Handbook
นำเสนอลักษณะโครงสร้างของชุดข้อมูล Market Microstructure ของไทย และการนำเอาโปรแกรม SAS มาใช้ในการทำความสะอาดชุดข้อมูล
โครงสร้างจุลภาคของตลาดหลักทรัพย์
แนะนำโครงสร้างจุลภาคของตลาดหลักทรัพย์ ซึ่งหมายถึงปฏิสัมพันธ์ระหว่างองค์ประกอบจุลภาคของตลาดอันได้แก่ ระบบการซื้อขายหลักทรัพย์ มูลเหตุจูงใจการเทรดหลักทรัพย์และรูปแบบส่งคำสั่งซื้อขายของนักลงทุน การวัดสภาพคล่องรวมถึงกฎเกณฑ์ที่กำกับควบคุมการซื้อขายบนกระดานอิเล็กโทรนิกส์ และการนำข้อมูลระดับจุลภาคของตลาดมาเสนอสถิติด้านสภาพคล่อง ความผันผวนของอัตราผลตอบแทน และพฤติกรรมนักลงทุนในรูปแบบที่เข้าใจง่ายด้วยโปรแกรม Python
Behavioral Finance and Dynamics of Trading
พูดถึงแนวคิดที่สำคัญในการทำวิจัยด้าน Market Microstructure ผู้เขียนได้อธิบายถึงลักษณะพฤติกรรมของผู้เล่นในตลาดผ่านมุมมองของพฤติกรรมทางการเงิน (Behavioral Finance) ตลอดจนนำเสนอรูปแบบการประยุกต์ใช้ข้อมูลในการทำวิจัยในหลายมิติ อาทิ การทำการศึกษา Event Studies การจัดทำแบบจำลองด้านความผันผวน เป็นต้น
วิดีโอประกอบการเตรียมข้อมูล Deal Files และ Order Files ด้วยโปรแกรม SAS
Import Reference Stock Lists
เริ่มต้นของการทำความสะอาดข้อมูล deal file โดยเริ่มจากการนำเข้ารายชื่อหุ้นในกลุ่ม SET50 และ SET100 ซึ่งอยู่ในรูปแบบไฟล์ CSV เข้าสู่โปรแกรม SAS และสร้างชุดข้อมูล setlist เพื่อใช้อ้างอิงและเป็นตัวกรองหลักทรัพย์ในขั้นตอนต่อไป
นอกจากนี้ ยังอธิบายการเปลี่ยนชื่อตัวแปรดิบใน deal file รวมถึงการปรับรูปแบบวันที่ของข้อมูลธุรกรรมทั้งหมดให้อยู่ในรูปแบบเดียวกัน คือ Month/Day/Year เพื่อให้สามารถนำไปวิเคราะห์ต่อไปได้
Initialize & Pre-process Deal Files
เป็นขั้นตอนการตั้งค่าและเตรียมข้อมูล deal files ก่อนการวิเคราะห์ โดยเริ่มจากการกำหนดชื่อ SAS libraries สำหรับจัดเก็บไฟล์ข้อมูลดิบ และ library สำหรับผลลัพธ์ทางสถิติ ก่อนจำนำ deal file เข้าสู่ work folder
เนื้อหาหลักครอบคลุมการจำแนกประเภทผู้ซื้อและผู้ขายจากรหัสที่กำหนดไว้ เช่น นักลงทุนรายย่อย กองทุนรวม และนักลงทุนต่างชาติ การจัดกลุ่มข้อมูลตามช่วงเวลาการซื้อขายระหว่างวัน (เช่น ช่วงเวลา 30 นาที) และการสร้างตัวแปรวันที่เพื่อใช้ในการวิเคราะห์ Time Series
Standardize Order File Variables & Filter Stocks
อธิบายขั้นตอนการจัดการข้อมูล order files โดยเริ่มจากการกำหนดไลบรารีสำหรับไฟล์คำสั่งซื้อขายทั้งในส่วนข้อมูลนำเข้าและผลลัพธ์ จากนั้นอธิบายการเปลี่ยนชื่อตัวแปรให้เป็นชื่อที่ชัดเจนและมีความหมายตามเนื้อหาของข้อมูล
และอธิบายคัดเลือกเฉพาะหุ้นในกลุ่ม SET100 จากชุดข้อมูลตามขอบเขตของโครงการ พร้อมทั้งปรับรูปแบบวันที่ให้อยู่ในมาตรฐาน Month/Day/Year เช่นเดียวกับ deal file เพื่อให้ข้อมูลทั้งสองชุดสามารถเชื่อมโยงและวิเคราะห์ร่วมกันได้
Consolidate & Store Deal Data with Statistical Summaries
ขั้นตอนสุดท้ายของกระบวนการ โดยอธิบายการรวมข้อมูลสรุปรายเดือนของ deal file เข้าด้วยกันเพื่อสร้างชุดข้อมูลรายปีได้อย่างสมบูรณ์ พร้อมทั้งการคำนวณสถิติในระดับช่วงเวลา 30 นาที (half-hour interval) สำหรับตัวแปรสำคัญ เช่น ราคาซื้อขาย (ค่าเฉลี่ย มัธยฐาน ค่าสูงสุด–ต่ำสุด และราคาเฉลี่ยถ่วงน้ำหนักตามปริมาณซื้อขาย (VWAP)) ปริมาณการซื้อขาย และมูลค่าการซื้อขาย
นอกจากนี้ ยังสรุปข้อมูลแยกตามประเภทผู้ซื้อและผู้ขาย เพื่อสะท้อนพฤติกรรมของนักลงทุนแต่ละกลุ่มอย่างชัดเจน ก่อนจะย้ายผลลัพธ์ที่ได้ไปจัดเก็บในพื้นที่จัดเก็บถาวร เพื่อรองรับการนำไปต่อยอดองค์ความรู้ได้ต่อไป
ผู้ที่สนใจศึกษาเพิ่มเติมเกี่ยวโครงการ สามารถดูรายละเอียดได้ที่ Thammasat Business School
และผู้ที่สนใจขอรับฐานข้อมูลสามารถเข้าศึกษารายละเอียดเพิ่มเติมบนเว็บไซต์ของทางตลาดหลักทรัพย์แห่งประเทศไทย โดยคลิกที่นี่