การทดสอบความแม่นยำของแบบจำลองที่สร้างขึ้นเพื่อทำนายสมบัติที่ต้องการวัด ทำได้โดยวิธีทางสถิติ โดยคำนวณค่าที่จำเป็นในการประเมินความแม่นยำและความถูกต้องของแบบจำลอง (Williams, 2007) ที่สำคัญได้แก่
1. สัมประสิทธิ์ความสัมพันธ์ (Coefficient of correlation, R)
สัมประสิทธิ์ความสัมพันธ์ (R) แสดงระดับซึ่งข้อมูล 2 ชุด (ข้อมูลตัวเลข X และ Y ในที่นี้ข้อมูล X คือข้อมูลจากการวัดด้วยวิธีอ้างอิง ข้อมูล Y คือข้อมูลจากการวัดด้วยวิธีเนียร์อินฟราเรดสเปกโทรสโกปี) สอดคล้องซึ่งกันและกัน ความสอดคล้องที่สมบูรณ์จะไม่มีความแตกต่างกันเลยระหว่าง 2 ชุดข้อมูล ผลของค่า R จะเท่ากับ 1.00 ในทางปฏิบัตินั้นเป็นไปไม่ได้ และ X และ Y อาจจะมีความสัมพันธ์เป็นเชิงบวกหรือลบก็ได้
2. สัมประสิทธิ์การพิจารณา (Coefficient of determination, R2)
แสดงสัดส่วนของความแปรปรวนในข้อมูล X ที่สามารถอธิบายโดยความแปรปรวนในข้อมูล Y ค่าของ R2 จะเป็นบวกเสมอ เช่น ถ้า R = 0.97 แล้ว R2 = 0.941 หมายความว่า 94.1% ของความแปรปรวนในข้อมูล X และ 5.9% ของความแปรปรวนในข้อมูล X เกิดขึ้นจากตัวแปรอื่น เช่นการเตรียมตัวอย่าง วิธีการทดลองอ้างอิง และอื่นๆ ค่า R2 เป็นบวกเสมอโดยไม่คำนึงถึงเครื่องหมายของ R ในทางปฏิบัติ R2ให้ข้อมูลมากกว่า R และใช้กันมากกว่า R การแปลความหมายของค่า R และ R2 แสดงดังตารางที่ 1
3. ความผิดพลาดมาตรฐานของการจำลอง (Standard error of calibration, SEC)
SEC คือ ค่า SD ของความแตกต่างระหว่างค่าที่ทำนายโดยเทคนิคเนียร์อินฟราเรดสเปกโทรสโกปีและค่าจากการวัดด้วยวิธีอ้างอิงในชุดตัวอย่างที่ใช้สร้างแบบจำลอง (Calibration set) ถ้าใช้ MLR จะพบว่า R และ SEC จะดีขึ้นเมื่อเพิ่มจำนวนตัวแปรต้นมากขึ้น สิ่งนี้เรียกว่า over-fitting ของข้อมูล ตามหลักค่า SEP (ดูข้อ 5) ควรจะสูงกว่า SEC เสมอ
ตารางที่ 1 การแปลความหมายของค่า R และ R2 (Williams, 2007)
4. ความผิดพลาดมาตรฐานของการทำ Cross-validation (Standard error of cross-validation, SECV)
Cross-validation สามารถใช้ตัวอย่างชุดเดียวกันกับที่ใช้ในการสร้างแบบจำลองเพื่อการทำการพิสูจน์แบบจำลอง (Validation) สิ่งนี้ทำโดยชักตัวอย่างออกหนึ่งตัวอย่างหรือกลุ่มของหลายตัวอย่างจากชุดสร้างแบบจำลองและสร้างแบบจำลองด้วยตัวอย่างที่เหลืออยู่ แล้วทำนายตัวอย่างที่ถูกกำจัดออกไปและบันทึกค่าความผิดพลาด แล้วนำตัวอย่างที่ถูกกำจัดออกไปนั้นกลับมาแล้วชักตัวอย่างอื่นออกไปและทำซ้ำกระบวนการจนกระทั่งตัวอย่างทั้งหมดถูกใช้ในการพัฒนาแบบจำลองและทำนาย จะไม่มีตัวอย่างที่ถูกทำนายถูกใช้ในการพัฒนาแบบจำลองซึ่งได้ใช้ในการทำนาย ถ้าเอาออกเพียงทีละ 1 ตัวอย่างจะเรียกว่า "Full" หรือ "One-out" cross-validation ถ้านำชุดตัวอย่าง (จำนวนหลายตัวอย่าง) ออกจะเรียกว่า "Segmented" cross-validation ส่วนเบี่ยงเบนมาตรฐานของความแตกต่างระหว่างค่าที่ถูกทำนายโดยเทคนิคเนียร์อินฟราเรดสเปกโทรสโกปีและค่าจากการวัดด้วยวิธีอ้างอิงของชุดสร้างแบบจำลอง คือ SECV วิธีพิสูจน์นี้เหมาะที่จะใช้กับข้อมูลที่มีจำนวนตัวอย่างน้อยๆ เช่น น้อยกว่า 100 ตัวอย่าง
5. ความผิดพลาดมาตรฐานของการทำนาย (Standard error of prediction, SEP หรือ SEV)
SEP ย่อมาจาก Standard error of prediction หรือ Standard error of performance แสดงสมรรถนะของการทำนาย บางครั้งใช้เทอม SEV (Standard error of validation) SEP เป็นค่าความเบี่ยงเบนมาตรฐานของความแตกต่างระหว่างค่าที่ทำนายโดยเทคนิคเนียร์อินฟราเรดสเปกโทรสโกปีและค่าจากการวัดด้วยวิธีอ้างอิง ซึ่งไม่เหมือนกับ RMSEP (Root mean square of the prediction) ซึ่งจะอธิบายต่อไปโดย SEP ไม่เกี่ยวข้องกับ Bias ค่า SEP คำนวณจากผลการทำนายของชุดตัวอย่างที่ไม่ได้ถูกใช้ในการพัฒนาแบบจำลอง ชุดตัวอย่างนี้เรียกว่า ชุดทำนาย (Prediction set)
6. ความผิดพลาด (Bias)
เมื่อทำนายค่าตัวแปรที่ต้องการของข้อมูลในชุดตัวอย่างทดสอบแบบจำลอง (Validation set) ค่า Bias หมายถึงความแตกต่างระหว่างค่าจากการวัดด้วยวิธีอ้างอิงและค่าที่ทำนายโดยเทคนิคเนียร์อินฟราเรดสเปกโทรสโกปีและเป็นการวัดความแม่นยำโดยรวมของแบบจำลอง (Calibration model) ในโลกความเป็นจริงของทางการค้าและอุตสาหกรรม Bias เป็นหนึ่งในสิ่งที่สำคัญมาก ในทางสถิติ Bias สามารถเกิดขึ้นได้แม้เมื่อค่าสถิติสัมประสิทธิ์ความสัมพันธ์และ SEP ที่แสดงว่าแบบจำลอง นั้นดีเยี่ยม
7. ค่าเฉลี่ยกำลังสองของการทำนาย (Root mean square of the prediction, RMSEP)
RMSEP เป็นค่าที่แสดงประสิทธิภาพของแบบจำลอง การคำนวณค่า RMSEP ได้รวมค่า Bias ไว้ด้วย ถ้าไม่มีค่า bias ค่า SEP และ RMSEP จะมีค่าเท่ากัน มีการใช้ RMSEP มากกว่า SEP แต่การรายงานผลโดยใช้ SEP กับ Bias แสดงถึงความแม่นยำของการทำนายได้ดี เนื่องจากRMSEP เกี่ยวข้องกับ Bias แต่ไม่ได้แสดงขนาดและเครื่องหมาย
8. อัตราส่วนระหว่าง SEP กับ SD (Ratio of SEP to the SD, RPD)
RPD ย่อมาจาก Ratio of (Standard error of) Prediction (Validation) to (Standard) Deviation แต่เป็นส่วนเบี่ยงเบนมาตรฐาน (SD) กับ อัตราส่วนของค่าความผิดพลาดมาตรฐานการทำนาย (SEP) ของข้อมูลของค่าอ้างอิงของชุดทำนาย ค่า SEP ควรต่ำกว่า SD มากๆ ซึ่งอัตราส่วนควรเท่ากับ 5 หรือมากกว่า บางกรณีตัวอย่างมีความสม่ำเสมอมาก ค่า SD จึงไม่สูง ซึ่ง RPD อาจจะไม่สูง ดังนั้น RPD เท่ากับ 2.5-3.0 ก็อาจแสดงถึงการวิเคราะห์ที่แม่นยำถ้า SD มีค่าเพียง 0.4-0.5
9. อัตราส่วนระหว่าง SEP กับช่วงข้อมูล (Ratio of the SEP to the range, RER)
RER คือ อัตราส่วนของช่วงกว้างของข้อมูลอ้างอิงของชุดทำนาย ต่อ SEP ค่า RER ควรจะสูงที่สุดเท่าที่จะเป็นไปได้ ตารางที่ 2 แสดงการอธิบายผลของค่า RPD และ RER
ตารางที่ 2 การอธิบายผลของค่า RPD และ RER (Williams, 2007)
การวัดองค์ประกอบทางเคมีของผลผลิตเกษตรและอาหารด้วยเทคนิคเนียร์อินฟราเรดสเปกโทรสโกปีเป็นสิ่งที่เข้าใจได้ง่าย เนื่องจากการผ่านคลื่นเนียร์อินฟราเรดเข้าไปทำให้พันธะทางเคมีที่เป็นตัวดูดซับ (Absorber) สั่นเสทือน แต่การวัดสมบัติทางกายภาพด้วยเทคนิคนี้อาจเข้าใจได้ยาก จะขอยกตัวอย่างกรณีของเนื้อสัมผัสเป็นซึ่งเป็นสมบัติทางกายภาพ เทคนิคนี้สามารถวัดสมบัตินี้ได้เนื่องจากเนื้อสัมผัสมีความสัมพันธ์กับโครงสร้างและองค์ประกอบทางเคมีภายในของวัสดุที่เกี่ยวข้องกับเนื้อสัมผัส เช่น ในผัก ผลไม้ เนื้อสัมผัสเกี่ยวข้องกับความดันเต่ง ซึ่งเกิดขึ้นเนื่องจากน้ำหรือของเหลวภายในเซลล์และเกี่ยวข้องกับปริมาณสารเพคตินที่รอยต่อระหว่างเซลล์ (Sirisomboon et al., 2000) ในเมล็ดพืชที่คัพภะ (Endosperm) ซึ่งมีเม็ดแป้งสตาร์ช (Starch granule) ซึ่งเกี่ยวข้องกับความแข็งของเมล็ดธัญพืช (Millar, 2004) ในอาหารประเภทเนื้อสัตว์ คลื่นเนียร์อินฟราเรดให้ข้อมูลเกี่ยวกับ โครงสร้างของเนื้อเยื่อระดับอัลตรา (Tissue ultra-structure) (Downey and Hildrum, 2004 อ้างโดย Prieto et al., 2009) ความชุ่มน้ำของเนื้อเป็นสมบัติเชิงเนื้อสัมผัสที่เกี่ยวข้องกับปริมาณไขมัน น้ำและโครงสร้างเส้นใยของเนื้อ (Warriss, 2000 อ้างโดย Prieto et al., 2009) ปริมาณคาเซอีน (Casein) ในน้ำนมมีผลต่อเนื้อสัมผัสของเนยแข็ง (Revilla et al., 2009) ความสัมพันธ์เช่นนี้เป็นอาจสาเหตุให้สามารถวัดเนื้อสัมผัสโดยเทคนิคเนียร์อินฟราเรดสเปกโทรสโกปีได้