نقش دادههای ایکسجی (Expected Goals یا xG) در پیشبینی فوتبال؛ از یک شاخص آماری تا ستون فقرات مدلهای شرطبندی حرفهای
در دو دهه اخیر، کمتر مفهومی به اندازه «Expected Goals» یا xG توانسته نگاه تحلیلگران فوتبال، مدیران باشگاهها و شرطبندان حرفهای را دگرگون کند. امروزه تقریباً تمام تیمهای نخبه اروپایی، شرکتهای تحلیل داده و سندیکاهای شرطبندی از xG به عنوان یکی از مهمترین ابزارهای ارزیابی عملکرد و پیشبینی نتایج استفاده میکنند.
اما xG دقیقاً چیست؟ چگونه محاسبه میشود؟ چرا برخی تحلیلگران آن را انقلابی در علم فوتبال میدانند و برخی دیگر معتقدند که بیش از حد بزرگنمایی شده است؟ و مهمتر از همه، چگونه میتوان از xG برای یافتن مزیت آماری در بازارهای شرطبندی استفاده کرد؟
ایکس جی چیست؟
ایکس جی یا Expected Goals به معنای «گلهای مورد انتظار» است و احتمال تبدیل شدن شوت ها به گل را اندازهگیری میکند.
اگر xG یک شوت برابر 0.75 باشد، یعنی انتظار میرود آن شوت در 75 درصد موارد به گل تبدیل شود.
اگر xG برابر 0.03 باشد، احتمال گل شدن آن تنها 3 درصد است.
بنابراین ایکس جی کیفیت موقعیت را اندازهگیری میکند، نه نتیجه نهایی آن را.
چرا xG به وجود آمد؟
برای دههها، تحلیل فوتبال بر پایه آمار سنتی انجام میشد:
- تعداد شوتها؛
- درصد مالکیت توپ؛
- تعداد پاسها؛
- تعداد کرنرها.
اما این آمار یک مشکل بزرگ داشتند:
همه شوتها ارزش یکسانی ندارند.
مثلاً:
- یک شوت از فاصله دو متری مقابل دروازه؛
- یک شوت از فاصله ۳۵ متری.
هر دو یک «شوت» محسوب میشوند، اما احتمال گل شدن آنها کاملاً متفاوت است.
اینجا بود که تحلیلگران داده تصمیم گرفتند کیفیت موقعیتها را کمیسازی کنند.
ایکس جی چگونه محاسبه میشود؟
محاسبه xG بر پایه مدلهای آماری انجام میشود.
این مدلها با استفاده از صدها هزار یا حتی میلیونها شوت تاریخی آموزش میبینند.
برای هر شوت، متغیرهای متعددی ثبت میشود.
متغیرهای اصلی در مدلهای xG
۱. فاصله تا دروازه (Shot Distance)
مهمترین متغیر.
هرچه فاصله کمتر باشد:
احتمال گل افزایش مییابد.
۲. زاویه شوت (Shot Angle)
شوت از مقابل دروازه ارزش بیشتری نسبت به زوایای بسته دارد.
۳. نوع پاس منجر به شوت
مانند:
- پاس زمینی؛
- پاس هوایی؛
- سانتر؛
- پاس عمقی؛
- کاتبک (Cut-back)
۴. نوع ضربه
- پای راست؛
- پای چپ؛
- ضربه سر؛
- ضربه والی.
۵. شرایط بازی
- ضدحمله؛
- بازی در جریان؛
- ضربه آزاد؛
- پنالتی؛
- کرنر.
۶. فشار مدافعان
در محاسبات پیشرفته تر :
- فاصله مدافع؛
- تعداد مدافعان اطراف مهاجم؛
- موقعیت دروازهبان.
نیز لحاظ میشود.
مدلهای آماری مورد استفاده در xG
مدلهای ابتدایی از روشهای ساده استفاده میکردند.
اما امروزه مدلهای فوق تخصصی شامل موارد زیر هستند:
Logistic Regression
رایجترین مدل اولیه.
احتمال گل شدن شوت را تخمین میزند.
Gradient Boosting Machines (GBM)
مانند:
- XGBoost
- LightGBM
که روابط غیرخطی پیچیده را شناسایی میکنند.
Random Forest
ترکیبی از صدها درخت تصمیم برای افزایش دقت پیشبینی.
Neural Networks
در مدلهای مدرن شرکتهایی مانند StatsBomb.
Deep Learning
برای تحلیل دادههای موقعیتی بازیکنان (Tracking Data).
تفاوت xG و گل واقعی
این دو مفهوم یکسان نیستند.
مثلاً تیمی ممکن است 3گل بزند اما xG آن برابر 0.9 باشد.این یعنی احتمالاً از موقعیتهای کم کیفیت، گلهای غیرمعمولی به ثمر رسانده است.
برعکس ممکن است تیمی هیچ گلی نزند؛اما xG آن 2.8 باشد. در این حالت احتمالاً بدشانس بوده یا دروازهبان حریف عملکرد فوقالعادهای داشته است.
مفهوم Underlying Performance
یکی از مهمترین کاربردهای xG، سنجش عملکرد زیربنایی تیمها است.
نتایج فوتبال دارای نویز بالایی هستند.
اما xG کمک میکند بفهمیم:
«آیا عملکرد واقعی تیم با نتایج کسبشده همخوانی دارد؟»
Regression Toward the Mean
یکی از مفاهیم فوق تخصصی در تحلیل فوتبال.
اگر تیمی به طور مداوم بیشتر از xG خود گل بزند:
ممکن است دچار «بازگشت به میانگین» شود.
مثلاً:
گل زده: 50
xG: 37
احتمال دارد در آینده راندمان گلزنی کاهش یابد.
برعکس نیز صادق است.
ایکس جی و شرطبندی حرفهای:
اینجاست که xG اهمیت فوقالعادهای پیدا میکند.
شرطبندان آماتور به نتایج نگاه میکنند.اما حرفهایها به کیفیت عملکرد نگاه میکنند.
یافتن تیمهای Overvalued
تیمهایی که گلهای زیادی زدهاند، اما xG پایینی دارند.بازار معمولاً آنها را بیش از حد ارزشگذاری میکند.
یافتن تیمهای Undervalued
تیمهایی که نتایج ضعیفی گرفتهاند،اما xG بالایی دارند.بازار معمولاً آنها را دستکم میگیرد.
xG Differential
یکی از قدرتمندترین شاخصها.
فرمول:
xGD = xGF − xGA
که در آن:
- xGF = ایکس جی مورد انتظار تولید شده
- xGA = ایکس جی مورد انتظار دریافتشده
است.
تفسیر xGD
اگرxGD = +0.80 باشد، تیم به طور متوسط در هر بازی 0.8 موقعیت باکیفیت بیشتر از حریف ایجاد کرده است.
این شاخص در بسیاری از تحقیقات، همبستگی بیشتری با موفقیت آینده نسبت به تفاضل گل واقعی نشان داده است.
ایکس جی و مدلهای پواسون
بسیاری از مدلهای شرطبندی فوتبال از توزیع پواسون استفاده میکنند.
فرآیند کلی:
مرحله اول:
تخمین xG دو تیم.
مثلاً:
تیم میزبان: ۱.۹
تیم مهمان: ۰.۸
مرحله دوم:
استفاده از توزیع پواسون برای برآورد احتمال:
- برد میزبان؛
- مساوی؛
- برد مهمان؛
- اوور و آندر؛
- نتیجه دقیق.
مزایای xG:
عینیت بیشتر به جای تکیه بر برداشت ذهنی
حذف بخشی از شانس
تفکیک عملکرد واقعی از نتایج تصادفی.
قدرت پیشبینی بالا بهویژه در نمونههای میانمدت.
کشف ناکارآمدی بازار
شناسایی تیمهای کمتر یا بیشتر ارزشگذاریشده
ارزیابی بازیکنان
اندازهگیری کیفیت خلق موقعیت.
محدودیتهای xG:
هیچ مدلی کامل نیست و ایکس جی نیز نقاط ضعف دارد.
نادیده گرفتن کیفیت تمامکنندگی:
برخی مهاجمان واقعاً بهتر از میانگین هستند.مثل:
- هری کین
- ارلینگ هالند
- لیونل مسی
که ممکن است برای سالها بالاتر از xG خود گل بزنند.
تفاوت مدلها:
مدلهای:
- Opta
- StatsBomb
- Understat
ممکن است برای یک شوت، xG متفاوتی ارائه دهند.
نادیده گرفتن عوامل روانی
مانند:
- فشار مسابقه؛
- اهمیت بازی؛
- خستگی ذهنی.
وابستگی به کیفیت داده ، یعنی
Tracking Data،پ
منجر به xG ضعیف خواهد شد.
نسل پیشرفته تر ایکس جی یا Post-Shot xG علاوه بر کیفیت موقعیت، کیفیت اجرای ضربه را نیز بررسی میکند ومتغیرهایی مانند سرعت توپ؛ محل دقیق شوت و واکنش دروازه بان. در آن لحاظ میشود.
نسل جدید تحلیل تهاجمی یا ایکس تی xThreat (xT):
ایکس تی ، به جای تمرکز صرف بر شوت، ارزش هر حرکت در نزدیکتر کردن تیم به گل را اندازهگیری میکند.
Expected Assists (xA):
احتمال گل شدن پاسهای کلیدی ابزاری مهم برای ارزیابی خلاقیت بازیکنان است.
کاربرد xG در باشگاههای حرفهای
امروزه باشگاههای بزرگی مانند:
- لیورپول؛
- آرسنال؛
- برایتون؛
- برنتفورد؛
- میتیولن دانمارک.
از مدلهای مبتنی بر xG در استعدادیابی نقلوانتقالات؛ تحلیل مسابقات و تصمیمگیری تاکتیکی استفاده میکنند.
ایکس جی بهترین شاخص عمومی موجود برای توصیف کیفیت فرصتهای گلزنی و پیشبینی عملکرد آینده تیمها است.ایکس جی آینده را نمیبیند. بلکه با حذف بخشی از نویز نتایج، تصویری دقیقتر از واقعیت ارائه میدهد. ایکسجی، فوتبال را از یک بازی صرفاً مبتنی بر احساس و روایت، به حوزهای نزدیکتر به علم داده و تحلیل احتمالات تبدیل کرده است.
برای تحلیلگران حرفهای، xG صرفاً یک عدد نیست؛ بلکه ابزاری برای کشف حقیقت پنهان پشت نتایج است. این شاخص کمک میکند تشخیص دهیم کدام تیم واقعاً خوب بازی کرده، کدام نتایج حاصل خوششانسی بودهاند و کجا بازار شرطبندی در قیمتگذاری دچار خطا شده است.
در نهایت، موفقترین تحلیلگران و شرطبندان فوتبال کسانی نیستند که تنها به جدول ردهبندی یا نتایج اخیر نگاه میکنند؛ بلکه کسانی هستند که دادههای زیربنایی مانند xG را در کنار دانش تاکتیکی، مدلهای آماری و مدیریت ریسک به کار میگیرند تا از دل آشوب ظاهری فوتبال، الگوهای پایدار و مزیتهای آماری استخراج کنند.
در عصر فوتبال دادهمحور، xG نه یک مد زودگذر، بلکه زبان مشترک علم، تاکتیک و پیشبینی محسوب میشود.

