Hvor meget vand bruger AI?

Hvor meget vand bruger AI?

Jeg vedder på, at du har hørt alt fra "AI drikker en flaske vand for hver par spørgsmål" til "det er dybest set et par dråber". Sandheden er mere nuanceret. AI's vandfodaftryk svinger meget afhængigt af, hvor den kører, hvor lang din prompt er, og hvordan et datacenter køler sine servere. Så ja, overskriftstallet findes, men det gemmer sig i en krat af forbehold.

Nedenfor uddrager jeg klare, beslutningsklare tal, forklarer hvorfor estimaterne er uenige, og viser, hvordan bygherrer og almindelige brugere kan reducere vandregningen uden at blive til bæredygtighedsmunke.

Artikler du måske har lyst til at læse efter denne:

🔗 Hvad er et AI-datasæt
Forklarer, hvordan datasæt muliggør maskinlæringstræning og modeludvikling.

🔗 Hvordan AI forudsiger tendenser
Viser, hvordan AI analyserer mønstre for at forudsige ændringer og fremtidige resultater.

🔗 Sådan måler du AI-ydeevne
Opdeler vigtige målinger til vurdering af nøjagtighed, hastighed og pålidelighed.

🔗 Sådan taler du med AI
Vejleder effektive strategier for at forbedre klarhed, resultater og konsistens.


Hvor meget vand bruger AI? Hurtige tal, du rent faktisk kan bruge 📏

  • Pr. prompt, typisk interval i dag: fra submilliliter for en median tekstprompt på ét mainstream-system, op til ti milliliter for et længere svar med højere beregningshastighed på et andet. For eksempel rapporterer Googles produktionsregnskab en median tekstprompt på ~0,26 mL (inklusive fuld visningsoverhead) [1]. Mistrals livscyklusvurdering anslår et 400-token assistentsvar til ~45 mL (marginal inferens) [2]. Kontekst og model betyder meget.

  • Træning af en model i frontlinjeskala: kan løbe op i millioner af liter , primært fra køling og det vand, der er indlejret i elproduktion. En bredt citeret akademisk analyse anslog ~5,4 millioner liter til træning af en model i GPT-klassen, inklusive ~700.000 liter, der forbruges på stedet til køling - og argumenterede for smart planlægning for at sænke vandintensiteten [3].

  • Datacentre generelt: store anlæg bruger hundredtusindvis af gallon om dagen hos større operatører, med højere spidsbelastninger på nogle campusser afhængigt af klima og design [5].

Lad os være ærlige: disse tal føles usammenhængende i starten. Det er de. Og der er gode grunde.

 

Tørstig AI

AI-vandforbrugsmålinger ✅

Et godt svar på Hvor meget vand bruger AI? bør markere et par felter:

  1. Klar grænse
    Omfatter det kun kølevand på stedet , eller også vand uden for stedet kraftværker til at generere elektricitet? Bedste praksis skelner mellem vandudtag og vandforbrug og scope 1-2-3, svarende til CO2-regnskab [3].

  2. Stedsfølsomhed
    Vand pr. kWh varierer afhængigt af region og netmix, så den samme forsyning kan have forskellige vandpåvirkninger afhængigt af hvor den forsynes - en vigtig grund til, at litteraturen anbefaler tid- og stedbevidst planlægning [3].

  3. Realisme i arbejdsbyrden
    Afspejler tallet mediane produktionstimer , inklusive tomgangskapacitet og datacenteroverhead, eller kun acceleratoren i spidsbelastningsperioden? Google understreger fuld systemberegning (tomgang, CPU'er/DRAM og datacenteroverhead) for at kunne inferere, ikke kun TPU-matematikken [1].

  4. Køleteknologi
    Fordampningskøling, lukket væskekøling, luftkøling og nye direkte-til-chip- tilgange ændrer vandintensiteten dramatisk. Microsoft er i gang med at udrulle design, der har til formål at eliminere brugen af ​​kølevand til visse næste generations lokationer [4].

  5. Tidspunkt og årstid
    Varme, fugtighed og netforhold ændrer effektiviteten af ​​vandforbruget i det virkelige liv; en indflydelsesrig undersøgelse foreslår at planlægge større opgaver, når og hvor vandintensiteten er lavere [3].


Vandudtag vs. vandforbrug, forklaret 💡

  • Tilbagetrækning = vand taget fra floder, søer eller grundvandsmagasiner (noget returneret).

  • Forbrug = vand, der ikke returneres, fordi det fordamper eller indarbejdes i processer/produkter.

Køletårne ​​forbruger vand via fordampning. Elektricitetsproduktion kan udtrække store mængder (nogle gange bruge en del af det), afhængigt af anlæg og kølemetode. Et troværdigt AI-vandtal angiver, hvad det rapporterer [3].


Hvor vandet går hen i AI: de tre spande 🪣

  1. Scope 1 - køling på stedet
    Den synlige del: vand fordampet i selve datacentret. Designvalg som fordampning vs. luft eller lukket væskekredsløb sætter udgangspunktet [5].

  2. Scope 2 - elproduktion
    Hver kWh kan have en skjult vandmærke; blandingen og placeringen bestemmer det liter-pr. kWh-signal, som din arbejdsbyrde arver [3].

  3. Scope 3 - forsyningskæde
    Chipproduktion er afhængig af ultrarent vand i fremstillingen. Du vil ikke se det i en "per prompt"-måling, medmindre afgrænsningen eksplicit inkluderer indlejrede påvirkninger (f.eks. en fuld LCA) [2][3].


Udbydere i tal, med nuancer 🧮

  • Google Gemini-anmodninger
    Full-stack-serveringsmetoden (inklusive inaktiv drift og facilitetsoverhead). Medianteksten anmoder ~0,26 mL vand sammen med ~0,24 Wh energi; tallene afspejler produktionstrafik og omfattende grænser [1].

  • Mistral Large 2 livscyklus
    En sjælden uafhængig LCA (med ADEME/Carbone 4) afslører ~281.000 m³ til træning + tidlig brug og en inferensmarginal ~45 mL for et assistentsvar på 400 tokens

  • Microsofts ambition om nul vandkøling
    Næste generations datacentre er designet til at forbruge nul vand til køling og læner sig op ad direkte-til-chip-tilgange; administrativ brug kræver stadig noget vand [4].

  • Generel datacenterskala
    Store operatører rapporterer offentligt hundredtusindvis af gallon om dagen i gennemsnit på individuelle lokationer; klima og design presser tallene op eller ned [5].

  • Den tidligere akademiske baseline
    Den skelsættende "tørstige AI"-analyse estimerede millioner af liter til træning af GPT-klassemodeller, og at 10-50 mellemstore svar omtrent kunne svare til en 500 ml flaske - stærkt afhængigt af hvornår/hvor de kører [3].


Hvorfor estimaterne er så uenige 🤷

  • Forskellige grænser
    Nogle tal tæller kun køling på stedet ; andre inkluderer elektricitet og vand ; LCA'er kan inkludere chipproduktion . Æbler, appelsiner og frugtsalat [2][3].

  • Forskellige arbejdsbelastninger
    En kort tekstprompt er ikke en lang multimodal/kodekørsel; batching, samtidighed og latenstid er målrettet mod ændringsudnyttelse [1][2].

  • Forskellige klimaer og net
    Fordampningskøling i et varmt, tørt område ≠ luft/væskekøling i et køligt, fugtigt område. Netvandsintensiteten varierer meget [3].

  • Leverandørmetoder
    Google udgav en systemomfattende serveringsmetoder; Mistral udgav en formel livscyklusanalyse. Andre tilbyder punktestimater med sparse metoder. En højprofileret "en femtendedel af en teskefuld" pr. prompt skabte overskrifter - men uden afgrænsningsdetaljer er den ikke sammenlignelig [1][3].

  • Et bevægeligt mål
    Køling udvikler sig hurtigt. Microsoft afprøver vandfri køling på bestemte steder; udrulning af disse vil reducere vandforbruget på stedet, selvom elektricitet opstrøms stadig har et vandsignal [4].


Hvad du kan gøre i dag for at reducere AI's vandaftryk 🌱

  1. Tilpas modellens størrelse
    Mindre, opgavetilpassede modeller opnår ofte nøjagtighed, mens de bruger mindre datakraft. Mistrals vurdering understreger stærke korrelationer mellem størrelse og areal - og offentliggør marginale inferenstal, så man kan ræsonnere om afvejninger [2].

  2. Vælg vandbevidste regioner.
    Foretræk regioner med køligere klimaer, effektiv køling og net med lavere vandintensitet pr. kWh; arbejdet med "tørstig AI" viser, at tids- og stedbevidst planlægning hjælper [3].

  3. Skift arbejdsbyrder i tid.
    Planlæg træning/inferens af tunge batcher til vandeffektive timer (køligere nætter, gunstige netforhold) [3].

  4. Spørg din leverandør om transparente målinger af
    efterspørgsel efter vand pr. prompt , definitioner af grænser og om tallene inkluderer ledig kapacitet og anlægsomkostninger. Politiske grupper presser på for obligatorisk offentliggørelse for at muliggøre sammenligninger mellem æbler [3].

  5. Køleteknologi er vigtig.
    Hvis du bruger hardware, så overvej closed-loop/direct-to-chip køling . Hvis du er i skyen, så foretræk regioner/udbydere, der investerer i vandtætte designs [4][5].

  6. Brug gråvand og genbrugsmuligheder
    Mange campusser kan erstatte ikke-drikkelige kilder eller genbruge inden for kredsløb; store operatører beskriver balancering af vandkilder og kølevalg for at minimere nettopåvirkningen [5].

Et hurtigt eksempel for at gøre det til virkelighed (ikke en universel regel): at flytte et træningsjob natten over fra et varmt, tørt område midt på sommeren til et køligere, mere fugtigt område om foråret - og køre det i køligere perioder uden for spidsbelastning - kan ændre både vandforbruget på stedet uden for stedet (elnettet). Det er den slags praktisk, lavdramatisk planlægning, der kan give gevinster [3].


Sammenligningstabel: hurtige valg til at sænke AI's vandafgift 🧰

værktøj publikum pris hvorfor det virker
Mindre, opgavetilpassede modeller ML-teams, produktledere Lav–middel Mindre beregning pr. token = mindre køling + elektricitet og vand; bevist i LCA-lignende rapportering [2].
Regionsvalg efter vand/kWh Cloudarkitekter, indkøb Medium Skift til køligere klimaer og net med lavere vandintensitet; kombiner med efterspørgselsbevidst ruteføring [3].
Træningsvinduer på dagen MLO'er, planlæggere Lav Køligere nætter + bedre netforhold reducerer den effektive vandintensitet [3].
Direkte-til-chip/lukket-loop køling Datacenterdrift Mellem-høj Undgår fordampningstårne ​​hvor det er muligt, hvilket reducerer forbruget på stedet [4].
Spørgsmålslængde og batchkontroller App-udviklere Lav Begræns løbske tokens, batch smart, cache resultater; færre millisekunder, færre milliliter [1][2].
Tjekliste for gennemsigtighed for leverandører CTO'er, førende inden for bæredygtighed Gratis Tvinger frem klare grænser (on-site vs. off-site) og rapportering fra æbler til æbler [3].
Gråvand eller genvundne kilder Faciliteter, kommuner Medium At erstatte ikke-drikkevand aflaster drikkevandsforsyningen [5].
Partnerskaber om varmegenbrug Operatører, lokale råd Medium Bedre termisk effektivitet reducerer indirekte kølebehovet og opbygger lokal goodwill [5].

("Prisen" er lav i sin design - implementeringer varierer.)


Dybdegående: Den politiske trommeslag bliver højere 🥁

Ingeniørorganisationer opfordrer til obligatorisk offentliggørelse af datacentres energi- og vandforbrug, så købere og lokalsamfund kan vurdere omkostninger og fordele. Anbefalingerne omfatter definitioner af omfang, rapportering på lokationsniveau og vejledning om placering - for uden sammenlignelige, lokationsbevidste målinger diskuterer vi i blinde [3].


Dybdegående: Datacentre bruger ikke alle strøm på samme måde 🚰

Der er en vedvarende myte om, at "luftkøling ikke bruger vand". Ikke helt. Lufttunge systemer kræver ofte mere elektricitet , som i mange regioner fører skjult vand fra nettet; omvendt vandkøling reducere strømforbruget og emissionerne på bekostning af vandforbruget på stedet. Store operatører afbalancerer eksplicit disse afvejninger fra sted til sted [1][5].


Dybdegående analyse: et hurtigt realitetstjek af virale påstande 🧪

Du har måske set dristige udsagn om, at en enkelt prompt er lig med "en vandflaske" eller, i den anden ende, "bare et par dråber". Bedre kropsholdning: ydmyghed med matematik . Dagens troværdige bogende er ~0,26 mL for en median produktionsprompt med fuld serveringsoverhead [1] og ~45 mL for et assistentsvar på 400 tokens (marginal inferens) [2]. Den ofte delte "en femtendedel af en teskefuld" mangler en offentlig afgrænsning/metode; behandl det som en vejrudsigt uden byen [1][3].


Mini-FAQ: Hvor meget vand bruger AI? igen, på almindeligt dansk 🗣️

  • Så hvad skal jeg sige på et møde?
    "Per prompt varierer det fra dråber til et par slurke , afhængigt af model, længde og hvor den foregår. Træning kræver pools , ikke vandpytter." Nævn derefter et eller to eksempler ovenfor.

  • Er AI unikt dårlig?
    Den er unikt koncentreret : højtydende chips pakket sammen skaber store kølebelastninger. Men datacentre er også der, hvor den mest effektive teknologi har tendens til at lande først [1][4].

  • Hvad nu hvis vi bare flytter alt til luftkøling?
    Man kan måske skære ned på vandforbruget på stedet , men øge uden for stedet via elektricitet. Sofistikerede operatører vejer begge dele [1][5].

  • Hvad med fremtidens teknologi?
    Design, der undgår kølevand i stor skala, ville være banebrydende for Scope 1. Nogle operatører bevæger sig i denne retning; opstrøms elektricitet bærer stadig et vandsignal, indtil nettene ændres [4].


Afsluttende bemærkninger - For langt, jeg læste det ikke 🌊

  • Pr. prompt: tænk fra submilliliter til ti milliliter , afhængigt af model, promptlængde og hvor den kører. Median prompt ~0,26 ml på én større stak; ~45 ml for et svar på 400 tokens på en anden [1][2].

  • Træning: millioner af liter til frontlinjemodeller, hvilket gør planlægning, placering og køleteknologi kritisk [3].

  • Hvad skal man gøre: modeller i den rigtige størrelse, vælge vandvenlige områder, flytte tunge opgaver til køligere timer, foretrække leverandører, der leverer vandlette designs, og kræve transparente grænser [1][3][4][5].

Lidt mangelfuld metafor til afslutning: AI er et tørstigt orkester - melodien er computerkraft, men trommerne køler og er vand. Stem bandet, og publikum får stadig musikken uden at sprinklerne går i gang. 🎻💦


Referencer

  1. Google Cloud Blog - Hvor meget energi bruger Googles AI? Vi har lavet beregningerne (metode + ~0,26 ml median prompt, fuld serveringsomkostning). Link
    (Teknisk artikel PDF: Måling af miljøpåvirkningen af ​​levering af AI på Google-skala .) Link

  2. Mistral AI - Vores bidrag til en global miljøstandard for AI (LCA med ADEME/Carbone 4; ~281.000 m³ træning + tidlig brug; ~45 mL pr. 400-token svar, marginal inferens). Link

  3. Li et al. - Gør AI mindre "tørstig": Afdækning og håndtering af det hemmelige vandfodaftryk i AI-modeller (træning af millioner af liter , tids- og stedbevidst planlægning, udtag vs. forbrug). Link

  4. Microsoft - Næste generations datacentre bruger intet vand til køling (direkte-til-chip-design, der sigter mod vandfri køling på bestemte steder). Link

  5. Google Datacentre - Bæredygtig drift (afvejninger af køling fra sted til sted; rapportering og genbrug, herunder genvundet/gråt vand; typisk daglig brug på stedniveau i størrelsesordener). Link

Find den nyeste AI i den officielle AI-assistentbutik

Om os

Tilbage til bloggen