GCP Cost Optimization 2026: Οδηγός με Committed Use Discounts, Spot VMs και FinOps
Πρακτικός οδηγός 2026 για μείωση κόστους GCP κατά 30%–70% με Committed Use Discounts, Spot VMs, BigQuery Editions και FinOps. Με έτοιμα gcloud παραδείγματα, στρατηγικές για GKE, Cloud Storage και βήμα-βήμα setup billing export στο BigQuery.
Η βελτιστοποίηση κόστους στο Google Cloud (GCP) πετυχαίνει με συνδυασμό Committed Use Discounts (CUDs) για το σταθερό φορτίο, Spot VMs για διακοπτόμενα workloads και αυστηρή FinOps διακυβέρνηση με billing exports στο BigQuery. Στον οδηγό αυτό για το 2026 θα δεις πρακτικές τεχνικές που μπορούν να μειώσουν τον λογαριασμό σου GCP κατά 30%–70% χωρίς απώλεια απόδοσης, με έτοιμα gcloud παραδείγματα, στρατηγικές για Compute Engine, GKE, BigQuery και Cloud Storage, καθώς και πραγματικά νούμερα από τον επίσημο τιμοκατάλογο της Google.
Τα Resource-based CUDs προσφέρουν έως 57% έκπτωση σε δεσμεύσεις 3 ετών, ενώ τα Flexible (spend-based) CUDs καλύπτουν πολλαπλές οικογένειες μηχανών με 28%–46% μείωση.
Τα Spot VMs αντικατέστησαν τα Preemptible VMs το 2020 και τιμολογούνται 60%–91% χαμηλότερα από τα standard on-demand instances με δυναμική τιμολόγηση.
Τα Sustained Use Discounts (SUDs) εφαρμόζονται αυτόματα σε N1/N2/E2/N2D instances που τρέχουν πάνω από το 25% του μήνα, χωρίς δέσμευση.
Το BigQuery Editions (Standard, Enterprise, Enterprise Plus) με slot autoscaling και 1-year/3-year commitments αντικατέστησε το flat-rate model τον Ιούλιο του 2023.
Το Active Assist Recommender εντοπίζει idle VMs, oversized instances και αχρησιμοποίητα persistent disks, με προτάσεις άμεσης εφαρμογής.
Η εξαγωγή Cloud Billing στο BigQuery με detailed usage cost δίνει FOCUS-compatible δεδομένα για cost allocation με labels.
CUDs vs SUDs: ποια έκπτωση επιλέγω;
Ας ξεκινήσουμε από τη βάση. Η διαφορά ανάμεσα στα Committed Use Discounts (CUDs) και τα Sustained Use Discounts (SUDs) είναι θεμελιώδης για κάθε σχέδιο βελτιστοποίησης GCP. Τα CUDs απαιτούν δέσμευση 1 ή 3 ετών σε συγκεκριμένη ποσότητα vCPU/μνήμης ή σε ποσό δαπάνης ανά ώρα. Τα SUDs, αντίθετα, εφαρμόζονται αυτόματα όταν ένα instance τρέχει πάνω από το 25% του μήνα: χωρίς συμβόλαιο, χωρίς προπληρωμή.
Τα CUDs χωρίζονται σε δύο κατηγορίες:
Resource-based CUDs: Δεσμεύεσαι σε συγκεκριμένη οικογένεια μηχανών (π.χ. N2) και region. Παρέχουν τη μεγαλύτερη έκπτωση, έως 37% για 1 έτος και 57% για 3 έτη σε N2/N2D/C2/C2D.
Flexible (spend-based) CUDs: Δεσμεύεσαι σε ποσό $/ώρα και η έκπτωση εφαρμόζεται σε οποιαδήποτε οικογένεια εντός του πεδίου. Έκπτωση 28% (1 έτος) έως 46% (3 έτη), με πολύ μεγαλύτερη ευελιξία.
Χαρακτηριστικό
Resource-based CUD
Flexible CUD
SUD
Μέγιστη έκπτωση
57% (3 έτη)
46% (3 έτη)
30%
Δέσμευση
1 ή 3 έτη
1 ή 3 έτη
Καμία
Ευελιξία μηχανής
Συγκεκριμένη οικογένεια
Όλες οι οικογένειες
Αυτόματο
Project portability
Sharing εντός billing account
Sharing εντός billing account
Per-project
Καταλληλότητα
Steady-state production
Mixed workloads
Always-on χωρίς πρόβλεψη
Πρακτικός κανόνας: για παραγωγικά workloads με >70% σταθερότητα, ξεκίνα με Flexible CUDs που καλύπτουν το baseline και άσε τα SUDs να εφαρμόζονται στο επιπλέον. Σε δικό μου project πέρυσι, η μετάβαση από 100% on-demand σε 70% Flexible CUD + 30% Spot έβγαλε μηνιαία εξοικονόμηση γύρω στο 42% χωρίς καμία αλλαγή κώδικα. Αναλυτικές λεπτομέρειες υπάρχουν στην τεκμηρίωση Committed Use Discounts της Google.
Πώς δουλεύουν τα Spot VMs το 2026;
Τα Spot VMs είναι instances που τρέχουν στην ίδια ποιότητα hardware με τα standard, αλλά μπορούν να τερματιστούν (preempted) όταν το Compute Engine χρειάζεται πίσω την χωρητικότητα. Η Google αντικατέστησε τα παλιά Preemptible VMs με Spot VMs το 2020, καταργώντας το όριο των 24 ωρών και προσθέτοντας δυναμική τιμολόγηση που ενημερώνεται κάθε μήνα ανά region και family.
Οι εκπτώσεις κυμαίνονται από 60% έως 91% σε σχέση με τα on-demand και προβάλλονται σε realtime στη σελίδα τιμολόγησης. Για παράδειγμα, ένα n2-standard-4 στο us-central1 κοστίζει περίπου $0.194/ώρα on-demand και $0.0234/ώρα ως Spot (έκπτωση ~88%) το α' τρίμηνο του 2026.
Ο shutdown script έχει 30 δευτερόλεπτα να ολοκληρωθεί πριν το VM τερματιστεί. Σχεδίασε τα workloads σου ώστε να αποθηκεύουν checkpoint συχνά (π.χ. κάθε 5–10 λεπτά) σε Cloud Storage ή Spanner. Κατάλληλα use cases: batch ETL, CI/CD runners, ML training, video transcoding, fuzz testing. Για κρίσιμα stateful services, απόφυγε τα Spot VMs ή χρησιμοποίησε mixed instance groups.
Παρακολούθησε τη μέση συχνότητα preemption ανά region μέσω του Cloud Monitoring metric compute.googleapis.com/instance/preempted. Σύμφωνα με την επίσημη τεκμηρίωση Spot VMs, η μέση διάρκεια ζωής είναι 6–24 ώρες, αλλά παρατηρούνται σημαντικές διαφορές ανά region και ώρα της ημέρας.
Right-sizing με το Active Assist Recommender
Το Active Assist Recommender είναι η μηχανή προτάσεων του GCP που αναλύει 8 εβδομάδες χρήσης CPU/memory και προτείνει συγκεκριμένες αλλαγές machine type. Είναι δωρεάν, ενεργοποιείται αυτόματα και προσβάσιμο μέσω Console, API ή gcloud. Ειλικρινά, είναι το πρώτο εργαλείο που θα έπρεπε να ανοίγει κάθε νέος FinOps practitioner στο GCP.
Παράδειγμα εξαγωγής όλων των rightsizing προτάσεων σε JSON:
# Λήψη προτάσεων right-sizing για όλα τα project VMs
gcloud recommender recommendations list \
--project=my-prod-project \
--location=us-central1-a \
--recommender=google.compute.instance.MachineTypeRecommender \
--format=json > rightsizing.json
# Φιλτράρισμα μόνο των high-priority προτάσεων (>$50/μήνα εξοικονόμηση)
jq '.[] | select(.primaryImpact.costProjection.cost.units | tonumber < -50)' rightsizing.json
Πέρα από VMs, το Recommender καλύπτει αρκετές κατηγορίες πόρων:
Idle VM Recommender: εντοπίζει instances με <3% CPU για 14 ημέρες, υποψήφια για τερματισμό.
Idle Persistent Disk Recommender: μη συνδεδεμένοι δίσκοι που χρεώνονται $0.04–$0.17/GB/μήνα.
Idle IP Address Recommender: στατικές διευθύνσεις IP που δεν είναι attached σε resource ($0.005/ώρα = $3.65/μήνα ανά IP).
Unattended Project Recommender: ολόκληρα projects χωρίς activity για 180+ ημέρες.
Commitment Utilization Recommender: ποια CUDs δεν χρησιμοποιείς πλήρως.
Δες τη συνολική λίστα στην επίσημη βιβλιοθήκη Recommenders. Αυτοματοποίησε την εφαρμογή με Cloud Functions που τρέχουν εβδομαδιαία και ανοίγουν Jira tickets για κάθε προτεινόμενη ενέργεια άνω των $25/μήνα.
BigQuery Editions και slot reservations
Τον Ιούλιο του 2023 η Google απέσυρε το flat-rate model και εισήγαγε το BigQuery Editions: Standard, Enterprise και Enterprise Plus, με τιμολόγηση ανά slot-ώρα και autoscaling. Για το 2026, οι τιμές είναι $0.04/slot-hour (Standard), $0.06 (Enterprise) και $0.10 (Enterprise Plus) στο us-central1.
Το on-demand μοντέλο ($6.25/TB scanned) παραμένει διαθέσιμο, αλλά μετά τα 400 TB/μήνα οι reservations με commitment γίνονται οικονομικότερες. Η έκπτωση είναι 20% για 1-year και 40% για 3-year commitments.
Στρατηγική για cost control:
Ενεργοποίησε require_partition_filter=true σε όλους τους μεγάλους πίνακες ώστε να αποτρέπεται το full table scan.
Χρησιμοποίησε clustering σε columns που εμφανίζονται συχνά σε WHERE clauses (μειώνει το bytes processed κατά 80%–95%).
Όρισε custom quotas ($/ημέρα ανά project) ώστε ένα runaway query να μην αναιρεί τις προβλέψεις σου.
Μετακίνησε ψυχρά δεδομένα σε long-term storage (>90 ημέρες χωρίς edit) και κερδίζεις αυτόματη έκπτωση 50% στο storage.
-- Δημιουργία reservation με autoscaling 100→500 slots
bq mk --project_id=my-prod \
--location=US \
--reservation \
--slots=100 \
--autoscale_max_slots=500 \
--edition=ENTERPRISE \
analytics_reservation
-- Σύνδεση assignment ώστε το project να καταναλώνει από το reservation
bq mk --reservation_assignment \
--reservation_id=projects/my-prod/locations/US/reservations/analytics_reservation \
--job_type=QUERY \
--assignee_id=my-analytics-project \
--assignee_type=PROJECT
Cloud Storage: Autoclass και storage classes
Το Cloud Storage προσφέρει 4 κατηγορίες αποθήκευσης με διαφορετικές τιμές και SLAs: Standard ($0.020/GB/μήνα), Nearline ($0.010), Coldline ($0.004) και Archive ($0.0012). Η μετάβαση μεταξύ τους γίνεται είτε χειροκίνητα με lifecycle policies, είτε αυτόματα με Autoclass.
Το Autoclass παρακολουθεί ανά αντικείμενο τις προσβάσεις και το μετακινεί σε χαμηλότερη κλάση μετά από 30/90/365 ημέρες αδράνειας. Παράλληλα επαναφέρει το object σε Standard αν προσπελαστεί ξανά. Είναι ιδανικό για unpredictable access patterns, όπως user-uploaded content. Το επιπλέον κόστος είναι $0.0025/1000 objects/μήνα, αμελητέο για μεγάλους buckets.
Για προβλέψιμα patterns, προτίμησε explicit lifecycle JSON policy, γιατί δίνει σαφέστερο έλεγχο και μηδενικό overhead. Ταυτόχρονα, όρισε retention policies και object versioning limits γιατί οι παλιές versions χρεώνονται με την τιμή της original class. Για ολοκληρωμένη ανάλυση παρόμοιας στρατηγικής στο AWS, δες τον οδηγό μας για το AWS S3 Cost Optimization με Intelligent-Tiering.
Billing export στο BigQuery και FinOps reporting
Η εξαγωγή των detailed billing data στο BigQuery είναι το θεμέλιο κάθε σοβαρής FinOps πρακτικής στο GCP. Επιτρέπει ad-hoc SQL queries σε granular per-SKU, per-label, per-project δεδομένα και ενσωμάτωση με Looker, Grafana ή custom dashboards.
Ενεργοποίηση στο Cloud Console: Billing → Billing Export → Detailed usage cost. Επίλεξε dataset και ενεργοποίησε partition expiration για να ελέγξεις το ίδιο το κόστος του billing dataset (συνήθως κρατάμε 13 μήνες).
Παράδειγμα query για top-10 services κατά κόστος τον περασμένο μήνα:
SELECT
service.description AS service_name,
ROUND(SUM(cost), 2) AS total_cost,
ROUND(SUM(IFNULL((SELECT SUM(c.amount) FROM UNNEST(credits) c), 0)), 2) AS credits,
ROUND(SUM(cost + IFNULL((SELECT SUM(c.amount) FROM UNNEST(credits) c), 0)), 2) AS net_cost
FROM `my-billing-dataset.gcp_billing_export_resource_v1_XXXXXX`
WHERE DATE(usage_start_time) BETWEEN DATE_SUB(CURRENT_DATE(), INTERVAL 30 DAY) AND CURRENT_DATE()
GROUP BY service_name
ORDER BY net_cost DESC
LIMIT 10;
Για cost allocation κατά ομάδα ή προϊόν, χρησιμοποίησε labels σε όλα τα resources από την πρώτη μέρα. Επίβαλε σχήμα labels (π.χ. team, env, cost-center) μέσω Organization Policies και τερμάτισε resources που δεν συμμορφώνονται μετά από 7 ημέρες. Παρόμοιες FinOps τακτικές καλύπτουμε αναλυτικά στον οδηγό για FinOps για AI workloads.
GKE cost optimization με Cluster Autoscaler και Spot pools
Το Google Kubernetes Engine (GKE) έχει τέσσερις βασικούς μοχλούς κόστους: cluster management fee ($0.10/ώρα ανά Autopilot ή Standard zonal cluster, με 1 cluster δωρεάν), node compute, persistent disks και load balancers. Η σωστή αρχιτεκτονική μπορεί να μειώσει το κόστος ενός production cluster κατά 50%–70%.
Βέλτιστες πρακτικές για το 2026:
Cluster Autoscaler + node auto-provisioning: άσε το GKE να επιλέγει αυτόματα την κατάλληλη machine family ανά workload.
Spot node pool για stateless workloads με PodDisruptionBudget και graceful shutdown 25 δευτερολέπτων.
VPA σε recommendation mode για να βλέπεις προτάσεις χωρίς αυτόματη εφαρμογή σε production.
GKE Cost Allocation: ενεργοποίησε το metering ώστε να εξάγονται per-namespace/per-pod δεδομένα στο BigQuery.
# Δημιουργία Spot node pool με taints για ασφαλές scheduling
gcloud container node-pools create spot-pool \
--cluster=prod-cluster \
--region=us-central1 \
--machine-type=n2-standard-4 \
--spot \
--num-nodes=0 \
--enable-autoscaling --min-nodes=0 --max-nodes=20 \
--node-taints=cloud.google.com/gke-spot=true:NoSchedule
Συνηθισμένα anti-patterns που αυξάνουν το λογαριασμό
Στη FinOps πρακτική, οι ίδιοι τύποι σφαλμάτων επαναλαμβάνονται στις περισσότερες οργανώσεις GCP. Έχω συναντήσει τα παρακάτω σε σχεδόν κάθε audit που έχω κάνει τα τελευταία δύο χρόνια:
Public IP σε κάθε VM: $3.65/μήνα ανά static external IP. Χρησιμοποίησε Cloud NAT για outbound και Identity-Aware Proxy για inbound admin access.
Cross-region egress: μεταφορά μεταξύ us-central1 και europe-west1 κοστίζει $0.05/GB. Συγκέντρωσε analytics και υπηρεσίες στο ίδιο region.
Premium Network Tier εκεί που δεν χρειάζεται: επίλεξε Standard Tier για non-critical egress (μέχρι 80% οικονομία).
Default disks SSD pd-ssd: αν το workload δεν χρειάζεται >50K IOPS, χρησιμοποίησε pd-balanced ή pd-standard.
Cloud Logging υπερχείλιση: όρισε exclusion filters για debug logs σε production και sink σε Cloud Storage Coldline για archive.
BigQuery SELECT *: σαρώνει όλα τα columns και αυξάνει το cost ανά query 5–20×. Επίλεξε μόνο τα απαραίτητα fields.
Καθιέρωσε εβδομαδιαία FinOps review όπου παρουσιάζονται οι Recommender προτάσεις, οι top-10 cost centers από το BigQuery dashboard και η utilization των ενεργών CUDs. Πρακτικές που εφαρμόζονται διαρκώς αποδίδουν 25%–40% σταθερή μείωση κόστους σε ετήσιο ορίζοντα. Δεν είναι sexy, αλλά δουλεύει.
Συχνές ερωτήσεις
Πόσο εξοικονομώ με τα GCP Committed Use Discounts;
Από 28% έως 57%, ανάλογα με τον τύπο και τη διάρκεια. Τα Resource-based CUDs 3 ετών σε N2/C2 instances δίνουν έως 57%, ενώ τα Flexible (spend-based) CUDs φτάνουν 46% για 3 έτη με μεγαλύτερη ευελιξία.
Ποια είναι η διαφορά μεταξύ Spot VMs και Preemptible VMs;
Τα Spot VMs αντικατέστησαν τα Preemptible VMs το 2020. Διαθέτουν δυναμική τιμολόγηση που ενημερώνεται μηνιαία, δεν έχουν όριο 24 ωρών διάρκειας ζωής και προσφέρουν 60%–91% έκπτωση έναντι των on-demand instances.
Εφαρμόζονται αυτόματα τα Sustained Use Discounts;
Ναι. Τα SUDs εφαρμόζονται αυτόματα σε N1, N2, E2 και N2D instances που τρέχουν πάνω από το 25% του μήνα. Δεν απαιτείται καμία ρύθμιση και η έκπτωση φτάνει έως 30% για instances που τρέχουν ολόκληρο τον μήνα.
Πόσο κοστίζει το BigQuery στο 2026;
Στο on-demand model, $6.25/TB scanned. Στο Editions model, $0.04/slot-hour (Standard), $0.06 (Enterprise), $0.10 (Enterprise Plus), με commitment discounts 20% (1 έτος) ή 40% (3 έτη). Storage: $0.020/GB/μήνα active, $0.010/GB long-term.
Πώς εντοπίζω αχρησιμοποίητες πηγές στο GCP;
Μέσω του Active Assist Recommender, που αναλύει αυτόματα 8 εβδομάδες χρήσης και εντοπίζει idle VMs (<3% CPU), αχρησιμοποίητους persistent disks, μη συνδεδεμένες static IPs και projects χωρίς δραστηριότητα 180+ ημερών. Είναι δωρεάν και προσβάσιμο μέσω Console ή gcloud recommender.
Article changelog (1)
— SEO meta refreshed (title and description updated)
Hannah was a senior FinOps analyst at Spotify for four years, where she sat between the platform engineering org and the CFO's office, owning the showback model for 600+ engineering teams. She built the internal tool that broke down per-squad spend by Kafka topic, which the company still uses. Before Spotify she worked at Klarna on payments infrastructure cost, and started her career as a data engineer at Ericsson.
She holds the FinOps Certified Professional credential and AWS Solutions Architect Associate. Her writing leans heavily on the FinOps Foundation framework - inform, optimize, operate - and she has strong opinions about why reserved-instance utilization reports lie to you if you read them naively.
Hannah lives in Stockholm, writes mostly about multi-cloud chargeback, anomaly detection on daily spend, and the politics of getting engineers to care about a number that isn't latency. Eleven years total in the industry.