Horizontal Pod Autoscaler (HPA) - การขยายจำนวน Pod

โดยปกตินั้นหาก workload ที่ทำงานอยู่เดิมนั้นมีมีโหลดจากผู้ใช้ที่เพิ่มมากขึ้นเราสามารถที่จะทำการ scale out workload ให้เพิ่มมากขึ้นได้โดยการใช้ Horizontal Pod Autoscaler ของ kubernetes เอง โดยวิธีการใช้สามารถทำได้ตามตัวอย่างด้านล่าง

โดยเราสามารถเลือก target ที่เป็น Deployment/StatefulSet ที่ต้องการให้รองรับ HPA ได้ ซึ่งเพียงแค่กำหนด min/max repliacs และ metrics threshold ที่ต้องการนำมาเป็นเกณฑ์พิจารณาในการเริ่ม scale out อย่างเช่น เมื่อ CPU ของ workload นั้นๆใช้ถึง 80% ให้เริ่ม scale out โดย min replicas 2 และ max replicas 10 เมื่อ workload เกิด CPU usage มากกว่า 80% replicas จะเริ่ม scale จาก 2 replocas ขึ้นไปเรื่อยๆ (แต่ไม่เกิน 10 replicas) จน CPU Usage ต่ำกว่า 80% และเมื่อเวลาผ่านไป CPU usage ต่ำกว่า 80% แล้ว replicas จะเริ่ม scale down ลงมาที่ 2 replicas

Last updated

Was this helpful?