
ChatGPT -யில் நீங்கள் கேட்கும் ஒரு கேள்விக்கு எவ்வளவு ஆற்றல் செலவிடப்படும் என தெரியுமா?
செய்தி முன்னோட்டம்
ஜெனெரேட்டிவ் AI பொதுமக்களிடையே மிகவும் பொதுவானதாகி வருவதால், அதன் ஆற்றல் நுகர்வு மற்றும் கார்பன் உமிழ்வு பற்றிய கேள்விகள் பெருகிய முறையில் முக்கியத்துவம் பெறுகின்றன. OpenAI தலைமை நிர்வாக அதிகாரி சாம் ஆல்ட்மேன் சமீபத்தில் ஒரு "சராசரி ChatGPT வினவல்" ஒரு oven ஒரு வினாடிக்கு மேல் பயன்படுத்துவதற்கு சமமான ஆற்றலைப் பயன்படுத்துவதாகக் கூறினார். AI ஆராய்ச்சி நிறுவனமான Epoch AI முன்பு இதேபோன்ற மதிப்பீட்டைக் கணக்கிட்டதால், இந்த மதிப்பீடு பகுத்தறிவின் எல்லைக்குள் உள்ளது. இருப்பினும், நிபுணர்கள் அறிக்கையில் சரியான தகவல் இல்லை என்று நம்புகிறார்கள், குறிப்பாக "சராசரி" வினவல் எது என்பது குறித்து.
உமிழ்வு ஏற்றத்தாழ்வு
வெவ்வேறு AI மாதிரிகளில் மாறுபாடு
ஜூன் 19 அன்று ஃபிரான்டியர்ஸ் இன் கம்யூனிகேஷனில் வெளியிடப்பட்ட ஒரு ஆய்வு, மெட்டா மற்றும் டீப்சீக் உள்ளிட்ட 14 திறந்த மூல பெரிய மொழி மாதிரிகளை (LLMs) ஆய்வு செய்தது. சில மாதிரிகள் மற்றவற்றை விட 50 மடங்கு அதிகமாக CO2 ஐ வெளியிடுவதாக கண்டுபிடிப்புகள் வெளிப்படுத்தின. இந்தத் தரவு வெவ்வேறு AI மாதிரிகளில் கார்பன் உமிழ்வுகளின் மாறுபாட்டை எடுத்துக்காட்டுகிறது, இது ஒரு தூண்டுதலுக்கான சராசரி ஆற்றல் நுகர்வை மதிப்பிடும் பணியை மேலும் சிக்கலாக்குகிறது.
ஆற்றல் நுகர்வு
LLM-கள் ஏன் ஆற்றல் மிகுந்தவை?
பெரிய மொழி மாதிரிகள் (LLMகள்) அவற்றின் ஏராளமான அளவுருக்கள் காரணமாக அதிக ஆற்றல் நுகர்வுக்கு பெயர் பெற்றவை. இந்த உள் பயிற்சி மாதிரி, செயல்திறனை மேம்படுத்த பயிற்சியின் போது சரிசெய்யப்படுகின்றன. ஒரு மாதிரிக்கு அதிக அளவுருக்கள் இருந்தால், தரவுகளில் வடிவங்கள் மற்றும் உறவுகளைக் கற்றுக்கொள்ளும் திறன் அதிகமாகும். உதாரணமாக, GPT-4 ஒரு டிரில்லியன் அளவுருக்களைக் கொண்டிருப்பதாக மதிப்பிடப்பட்டுள்ளது மற்றும் உலகெங்கிலும் உள்ள மிகப்பெரிய தரவு மையங்களில் கிராபிக்ஸ் செயலாக்க அலகுகள் (GPUகள்) எனப்படும் சக்திவாய்ந்த சிப்களில் இயங்குகிறது.
உமிழ்வு மதிப்பீடு
பயிற்சி v/s அனுமான உமிழ்வுகள்
ஒரு LLM பயிற்சிக்கு பரந்த தரவுத்தொகுப்புகளைச் செயலாக்குவதும், உள் அளவுருக்களை சரிசெய்வதும் தேவைப்படுகிறது. இதற்கு வாரங்கள் மற்றும் ஆயிரக்கணக்கான GPUகள் ஆகும். இருப்பினும், நிறுவனங்கள் தங்கள் பயிற்சி முறைகளை அரிதாகவே வெளிப்படுத்துகின்றன, இதனால் இந்த செயல்முறையிலிருந்து உமிழ்வுகள் பெரும்பாலும் தெரியவில்லை. அனுமானம் அல்லது பயனர் தூண்டுதல்களுக்கு மாதிரியின் பதில், காலப்போக்கில் ஒரு மாதிரியின் பெரும்பாலான உமிழ்வுகளுக்குக் காரணமாக இருக்கும் என்று எதிர்பார்க்கப்படுகிறது. ஆனால் பயிற்சியைப் போலவே, ஒரு வினவலின் சுற்றுச்சூழல் தாக்கத்தை மதிப்பிடுவது தரவு மைய இருப்பிடம் மற்றும் அதை இயக்கும் ஆற்றல் கட்டம் போன்ற காரணிகளால் சிக்கலானது.
ஆராய்ச்சி முடிவுகள்
திறந்த மூல மாதிரிகளின் அனுமான உமிழ்வுகளை ஆய்வு அளவிடுகிறது
OpenAI மற்றும் Anthropic போன்ற நிறுவனங்களின் தனியுரிம மாதிரிகள் பொதுவில் கிடைக்காத நிலையில், Meta மற்றும் DeepSeek போன்ற பிற நிறுவனங்கள் தங்கள் AI தயாரிப்புகளின் திறந்த மூல பதிப்புகளை வெளியிட்டுள்ளன. ஆராய்ச்சியாளர்கள் இந்த மாதிரிகளை உள்ளூரில் இயக்கி, அனுமான ஆற்றல் நுகர்வுக்கான ப்ராக்ஸியாக தங்கள் GPU ஆல் நுகரப்படும் ஆற்றலை அளவிட முடியும். ஜூன் மாத ஆய்வில் NVIDIA A100 GPU இல் 14 திறந்த மூல AI மாதிரிகளை சோதித்தனர், மேலும் ஒரு கேள்விக்கு அதிக டோக்கன்களை செயலாக்குவதால், பகுத்தறிவு மாதிரிகள் நிலையானவற்றை விட அனுமானத்தின் போது அதிக ஆற்றலைப் பயன்படுத்துவதைக் கண்டறிந்தனர்.
மின் நுகர்வு
பகுத்தறிவு மாதிரிகள் ஒரு வினவலுக்கு 543.5 டோக்கன்களைப் பயன்படுத்துகின்றன
சராசரியாக, பகுத்தறிவு மாதிரிகள் ஒரு வினவலுக்கு 543.5 டோக்கன்களைப் பயன்படுத்துகின்றன - இது நிலையான மாதிரிகள் பயன்படுத்தும் 37.7 டோக்கன்களை விட மிக அதிகம். அளவில், உமிழ்வுகள் சேர்க்கப்படுகின்றன. 70 பில்லியன் அளவுரு பகுத்தறிவு மாதிரியான DeepSeek R1 உடன் 600,000 கேள்விகளுக்கு பதிலளிப்பது, லண்டனுக்கும் நியூயார்க்கிற்கும் இடையிலான ஒரு சுற்று-பயண விமானத்தின் அளவுக்கு CO₂ ஐ உருவாக்குகிறது. உண்மையான தாக்கம் இன்னும் அதிகமாக இருக்கலாம். தற்போது, தரவு மையங்களின் AI தேவைகள் உட்பட மொத்த அமெரிக்க மின்சார பயன்பாட்டில் 4.4% ஆகும். அந்தப் பங்கு 2028 ஆம் ஆண்டுக்குள் 12% வரை உயரக்கூடும்.
உமிழ்வு காரணிகள்
ஒரு மாதிரியின் கார்பன் தடயத்தை பாதிக்கும் காரணிகள்
ஒரு AI மாதிரியின் கார்பன் தடம், அது கொண்டிருக்கும் அளவுருக்களின் எண்ணிக்கை, அதன் கட்டமைப்பு மற்றும் அது எவ்வாறு பயிற்சி பெற்றது என்பது உள்ளிட்ட பல காரணிகளால் தீர்மானிக்கப்படுகிறது. இருப்பினும், இந்த விவரங்கள் பெரும்பாலும் நிறுவனங்களால் வெளியிடப்படுவதில்லை. ஒரு வினவலின் சுற்றுச்சூழல் தாக்கம், அது எந்த தரவு மையத்திற்குச் செல்கிறது மற்றும் நாள் அல்லது பருவத்தின் நேரம் போன்ற பிற மாறிகளைப் பொறுத்து பரவலாக மாறுபடும்.