Zêdekirina mezinahiyê ya bi AI çawa ji rêbazên guhertina mezinahiyê yên kevneşopî cuda ye?

Zêdekirina pîvana AI hûrguliyên çareseriya bilind ên windabûyî ji şablonên heyî yên di wêneyekê de pêşbînî dike, li şûna ku tenê pîkselan dirêj bike wekî rêbazên kevneşopî yên wekî interpolasyona bîkubîk. Ev dibe sedema wêneyên tûjtir û hûrgulîtir.

Dema ku ez bilindkirina AI-ê bikar tînim, divê ez li çi artefaktên hevpar binêrim?

Çewtiyên hevpar haloyên li dora qiraxan, şêweyên teksturê yên dubarekirî, rûyên pir nerm an mûmî, û nivîsa ku vediguhere 'hema hema tîpan' in. Girîng e ku van pirsgirêkan werin şopandin da ku encamek xwezayî were bidestxistin.

Çima rû carinan piştî bilindkirinê pir nerm an nerealîst xuya dikin?

Ji ber rakirina deng û tûjkirina êrîşkar ku dikare teksturên wekî poran ji holê rake, rû dikarin pir nerm xuya bikin. Ji bo bidestxistina xuyangek xwezayîtir, kêmkirina mîhengên rakirina deng û tûjkirinê bifikirin.

Ger piştî bikaranîna bilindkirina scalingê bi AI wêneyên min qirçqirç xuya bikin an jî dengekî zêde jê derkeve, divê ez çi bikim?

Heke wêneyên te qirçik xuya dikin, biceribîne ku slayderên kêmkirina deng û baştirkirina hûrguliyan rast bikî. Zêdekirina dendikên nazik jî dibe ku bibe alîkar ku hestek wênekêşiyê baştir bibe.

Modelên GAN û CNN çawa di encamên bilindkirina AI de têne berawirdkirin?

Modelên CNN bi gelemperî sabît û pêşbînîkirî ne, lê modelên GAN pir caran hûrguliyên tûjtir peyda dikin lê xetera têxistina hêmanên nerealîst hene. Hilbijartina di navbera wan de bi hewcedariya we ya realîzmê ve girêdayî ye li hember tekstûra pêşkeftî.

Gelo bilindkirina asta AI ji bo naveroka vîdyoyê guncaw e, û çi dijwarîyan derdixe holê?

Belê, bilindkirina asta AI ji bo vîdyoyê guncaw e lê ew dikare dijwar be ji ber ku hevgirtin di navbera çarçoveyan de pir girîng e. Hûrguliyên lerzok an şewqdar dikarin temaşevanan bikişînin, ji ber vê yekê rêbazên taybetî yên ku li ser vîdyoyê disekinin têne pêşniyar kirin.

Kengê ne guncaw e ku meriv xwe bispêre bilindkirina AI-ê?

Divê bilindkirina asta AI di senaryoyên bi xetereyên bilind de, wek rojnamegerî an analîza dadwerî, bi baldarî were bikar anîn, ku rastbûn pir girîng e. Çêtir e ku ew wekî başkirin were hesibandin ne wekî delîlek dawî, û şefafiyeta li ser pêvajoyên AI pir girîng e.

Dema ku wêneyên pir pêçayî bilind dikim, divê ez çi tiştan di hişê xwe de bigirim?

Ji bo wêneyên ku pir hatine pêçandin, bi rakirina berhemên nexwestî dest pê bikin da ku astengiya nexwestî kêm bikin. Piştî vê yekê, hûn dikarin pîvana wan bilind bikin û tûjkirina ronahiyê bicîh bînin ger hewce be da ku hûrguliyan biparêzin bêyî ku berhemên pêçandinê zêde bikin.

Zêdekirina AI çawa dixebite? [Vîdyo û Pirs]

Bersiva kurt: Bilindkirina AI bi perwerdekirina modelek li ser wêneyên kêm-çareseriya bilind ên hevberkirî dixebite, dûv re jî wê bikar tîne da ku di dema bilindkirinê de pîkselên zêde yên bawerbar pêşbînî bike. Ger model di perwerdeyê de tekstur an rûyên wekhev dîtibe, ew dikare hûrguliyên bawerbar lê zêde bike; ger ne wisa be, ew dikare di vîdyoyê de artefaktên wekî halo, çermê mûmî, an jî lerizînê "halûsînan" bike.

Xalên sereke:

Pêşbînî: Model hûrguliyên maqûl diafirîne, ne ji nû ve avakirina rastiyê ya garantîkirî ye.

Hilbijartina modelê: CNN bi gelemperî sabîttir in; GAN dikarin tûjtir xuya bikin lê xetera dahênana taybetmendiyan hene.

Kontrolkirina tiştên nedîtî: Li halo, teksturên dubare, "hema bêje tîpan", û rûyên plastîk temaşe bikin.

Stabîlîteya vîdyoyê: Rêbazên demkî bikar bînin, an na hûn ê çirûsk û guheztina çarçove-bi-çarçove bibînin.

Bikaranîna metirsiyên bilind: Ger rastbûn girîng e, pêvajoyê eşkere bikin û encaman wekî mînak bihesibînin.

Zêdekirina asta AI çawa dixebite? Infografîk.

Te belkî dîtibe: wêneyekî pir biçûk û qirçik vediguhere tiştekî têra xwe zelal ku bêyî tirsê were çapkirin, weşandin, an jî têxe nav pêşkêşiyekê. Ew wekî xapandinê xuya dike. Û - bi awayê herî baş - ew bi rastî jî wisa ye 😅

Ji ber vê yekê, Çawaniya Karê Bilindkirina AI vedigere tiştekî taybetîtir ji "komputer hûrguliyan zêde dike" (pêlên destan) û nêzîkî "modelek li gorî şablonên ku ji gelek mînakan fêr bûye avahiya çareseriya bilind a maqûl pêşbînî dike" (Deep Learning for Image Super-resolution: A Survey). Ew gava pêşbînîkirinê tevahiya lîstikê ye - û ji ber vê yekê ye ku bilindkirina AI dikare ecêb xuya bike… an hinekî plastîk… an jî mîna ku pisîka we mûyên zêde mezin kir.

Gotarên ku hûn dikarin piştî vê yekê bixwînin:

🔗 Çawa AI dixebite
Bingehên model, daneyan û texmînkirinê di AI de fêr bibin.

🔗 Çawa AI fêr dibe
Bibînin ka daneyên perwerdeyê û şîrove çawa performansa modelê bi demê re baştir dikin.

🔗 Çawa AI anomalîyan tespît dike
Xalên bingehîn ên qaliban û çawa AI tevgerên neasayî bi lez nîşan dide fêm bikin.

🔗 Çawa AI trendan pêşbînî dike
Rêbazên pêşbînîkirinê yên ku sînyalan destnîşan dikin û daxwaza pêşerojê pêşbînî dikin, bikolin.

Çawa AI Upscaling dixebite: fikra bingehîn, bi gotinên rojane 🧩

Zêdekirina pîvanan tê wateya zêdekirina çareseriyê: bêtir pîksel, wêneyek mezintir. Zêdekirina pîvanan a kevneşopî (wek bîkubîk) bi bingehîn pîkselan dirêj dike û veguheztinan nerm dike (interpolasyona Bîkubîk). Baş e, lê ew nikare nû - ew tenê interpolasyonê dike.

Bilindkirina pîvana AI tiştekî wêrektir diceribîne (di cîhana lêkolînê de wekî "super-çareserî" tê zanîn) (Fêrbûna Deep ji bo Super-çareseriya Wêneyê: Lêkolînek):

Ew li têketina kêm-çareseriyê dinêre
Şêweyan nas dike (qirax, tevn, taybetmendiyên rû, xêzên nivîsê, tevnkirina qumaşê…)
Pêşbînî dike ka guhertoyek bi çareseriya bilind divê çawa be
Daneyên pîkselên zêde çêdike ku li gorî wan şablonan e

Ne "rastiyê bi awayekî bêkêmasî sererast bike", bêtir mîna "texmînek pir bawerbar bike" (Wêneya Super-Resolution Bi Bikaranîna Torgilokên Kûr ên Konvolusyonî (SRCNN)). Ger ew hinekî gumanbar xuya bike, hûn ne xelet in - lê di heman demê de ev e sedema ku ew ewqas baş dixebite 😄

Û erê, ev tê vê wateyê ku bilindkirina AI di bingeh de halûsînasyona kontrolkirî ye ... lê bi awayekî hilberîner û rêzgirtina li pîkselan.

Çi guhertoyek baş a bilindkirina pîvana AI çêdike? ✅🛠️

Eger hûn li ser upscaler-ek AI-ê (an jî mîhengek pêşwext) dinirxînin, li vir tiştê ku herî zêde girîng e ev e:

Vegerandina hûrgiliyan bêyî zêde pijandinê.
Zêdekirina baş qirçîn û avahîyê zêde dike, ne dengê qirçînok an kunên sexte.
Disîplîna qiraxan
Xêzên paqij paqij dimînin. Modelên xirab dibin sedema lerizîna qiraxan an jî haleyên tavê.
Realîzma tekstûrê
Divê por nebe şopa firçeyê. Divê kerpîç nebe mohra qalibekî dubarekirî.
Birêvebirina deng û zextê
Gelek wêneyên rojane di formata JPEG de têne guherandin. Wêneyek baş a bilindkirinê (upscaler) zirarê zêde nake (Real-ESRGAN).
Hişyariya rû û nivîsê
Rû û nivîs cihên herî hêsan in ji bo dîtina xeletiyan. Modelên baş bi nermî tevdigerin (an jî modên taybetî hene).
Lihevhatin di navbera çarçoveyan de (ji bo vîdyoyê)
Ger hûrgulî çarçove bi çarçove biçirisin, çavên we dê biqîrin. Zêdekirina pîvana vîdyoyê bi sabîtbûna demkî dijî an dimire (BasicVSR (CVPR 2021)).
Kontrolên watedar
Hûn dixwazin slayderan ku bi encamên rastîn re têkildar bin: kêmkirina deng, paqijkirina şewqê, rakirina tiştên nedîtî, ragirtina dendikan, tûjkirin… tiştên pratîkî.

Qanûnek bêdeng ku derbasdar e: bilindkirina "baştirîn" pir caran ew e ku hûn hema hema ferq nakin. Tenê xuya dike ku we di destpêkê de kamerayek çêtir hebû 📷✨

Tabloya Berawirdkirinê: Vebijarkên populer ên bilindkirina AI (û ew ji bo çi baş in) 📊🙂

Li jêr berawirdkirinek pratîkî heye. Biha bi zanebûn nezelal in ji ber ku amûr li gorî lîsans, pakêt, lêçûnên hesabkirinê û hemî tiştên xweş diguherin.

Amûr / Rêbaz	Baştirîn ji bo	Atmosfera bihayê	Çima ew dixebite (bi qasî)
Bilindkerên sermaseyê yên bi şêwaza Topaz (Topaz Photo, Topaz Video)	Wêne, vîdyo, xebata hêsan	Bi qasî dravî	Modelên giştî yên bihêz + gelek mîhengkirin, bi gelemperî "tenê dixebitin"… bi piranî
Taybetmendiyên celebê "Super Resolution" a Adobe (Adobe Enhance > Super Resolution)	Wênesaz jixwe di wê ekosîstemê de ne	Abonetî-y	Ji nû ve avakirina hûrgulî ya zexm, bi gelemperî muhafezekar (kêmtir drama)
Guhertoyên Real-ESRGAN / ESRGAN (Real-ESRGAN, ESRGAN)	DIY, pêşdebir, karên komî	Belaş (lê demdirêj e)	Di hûrguliyên teksturê de pir baş e, heke hûn baldar nebin dikarin li ser rûyan tûj bin
Modên bilindkirina pîvanê yên li ser bingeha belavbûnê (SR3)	Karê afirîner, encamên şêwazkirî	Têkel	Dikare hûrguliyên xweşik biafirîne - her weha dikare bêwateyan jî îcad bike, ji ber vê yekê… erê
Bilindkirina asta lîstikê (bi şêwaza DLSS/FSR) (NVIDIA DLSS, AMD FSR 2)	Lîstik û pêşkêşkirina demrast	Pakêtkirî	Daneyên tevgerê û pêşiyên fêrbûyî bikar tîne - performansa xweş qezenc dike 🕹️
Xizmetên bilindkirina ewr	Rehetî, serketinên bilez	Pere-li-ser-bikaranînê bidin	Zû + pîvanbar, lê hûn kontrol û carinan jî nazikiyê diguherînin
Bilindkerên AI yên li ser vîdyoyê (BasicVSR, Topaz Video)	Dîmenên kevin, anime, arşîv	Bi qasî dravî	Hîleyên demkî ji bo kêmkirina lerizînê + modelên vîdyoyê yên taybetî
Bilindkirina pîvana telefon/galeriyê ya "aqilmend"	Bikaranîna nefermî	Tê de	Modelên sivik ji bo derana xweş hatine mîheng kirin, ne ji bo bêkêmasiyê (hîn jî bikêrhatî ne)

Dîtinên taybetmendiyê yên formatkirinê: "Paid-ish" di wê tabloyê de gelek kar dike. Lê hûn fikrê fêm dikin 😅

Raza mezin: model nexşerêyekê ji çareseriya nizm ber bi çareseriya bilind fêr dibin 🧠➡️🖼️

Di dilê piraniya bilindkirina asta AI de, sazûmaneke fêrbûna çavdêrîkirî heye (Çareseriya Bilind a Wêneyê Bi Bikaranîna Torgilokên Kûr ên Konvolusyonî (SRCNN)):

Bi wêneyên bi çareseriya bilind dest pê bikin ("rastî")
Wan kêm bikin bo guhertoyên bi çareseriya nizm ("têketin")
Modelek perwerde bike da ku çareseriya bilind a orîjînal ji çareseriya nizm ji nû ve ava bike

Bi demê re, model têkiliyên wekî:

"Ev cureyê nezelaliya li dora çavan bi gelemperî ji bo kirpikan e"
"Ev koma pixelan pir caran nivîsa serif nîşan dide"
"Ev gradyana qiraxê dişibihe xêzek banî, ne dengek bêserûber"

Ew ne jiberkirina wêneyên taybetî ye (bi wateya hêsan), ew fêrbûna avahiya îstatîstîkî ye (Fêrbûna Deep for Image Super-resolution: A Survey). Li wê mîna fêrbûna rêzimana tekstur û qiraxan bifikirin. Ne rêzimana helbestê, bêtir mîna… rêzimana destnivîsa IKEA 🪑📦 (metafora nebaş, lê têra xwe nêzîk).

Gûz û bolt: di dema texmînkirinê de çi dibe (dema ku hûn asta bilind dikin) ⚙️✨

Dema ku hûn wêneyek dixin nav upscaler-a AI-ê, bi gelemperî boriyek wekî vê heye:

Pêş-pêvajoyê
- Cihê rengan biguherîne (carinan)
- Nirxên pîkselan normal bike
- Heke wêneyê mezin be, perçe bike (kontrolkirina rastiya VRAM 😭) (Depoya Real-ESRGAN (vebijarkên kabloyê))
Derxistina taybetmendiyan
- Qatên destpêkê qirax, goşe û gradyanan tespît dikin
- Qatên kûrtir şêwazan tespît dikin: tevn, şekil, pêkhateyên rû
Dîsaavakirinî
- Model nexşeyek taybetmendiyên bi çareseriya bilindtir çêdike
- Dûv re wê vediguherîne derana rastîn a pixel
Piştî-pêvajoyê
- Tûjkirina bijarte
- Dengvedana bijarte
- Tepeserkirina berhemên bijartî (zengil, halo, astengî)

Hûrgiliyek nazik: gelek amûr di kaxizan de asta bilind dikin, dûv re jî dirûtinan tevlihev dikin. Amûrên mezin sînorên kaxizan vedişêrin. Amûrên Meh şopên torê yên lawaz dihêlin ger hûn çavên xwe bizivirînin. Û erê, hûn ê çavên xwe bizivirînin, ji ber ku mirov ji kontrolkirina kêmasiyên piçûk ên bi zoom 300% mîna gremlînên piçûk hez dikin 🧌

Malbatên modelên sereke yên ku ji bo bilindkirina AI-ê têne bikar anîn (û çima ew ji hev cuda hîs dikin) 🤖📚

1) çareseriya super a li ser bingeha CNN-ê (karkerê klasîk)

Torên neural ên konvolusyonî di qalibên herêmî de pir baş in: qirax, tekstur, avahiyên piçûk (Çareseriya Bilind a Wêneyê Bi Bikaranîna Torên Konvolusyonî yên Kûr (SRCNN)).

Erênî: bilez, aram, kêmtir surprîz
Nerênî: eger bi zorê were zextkirin, dikare hinekî "pêvajoyî" xuya bike

2) Bilindkirina li ser bingeha GAN (bi şêwaza ESRGAN) 🎭

GAN (Torgên Dijber ên Afirîner) jeneratorekê perwerde dikin da ku wêneyên bi çareseriya bilind hilberîne ku cudaker nikare wan ji yên rastîn cuda bike (Torgên Dijber ên Afirîner).

Awantaj: hûrguliyên balkêş, tekstûrek balkêş
Nerênî: dikare hûrgiliyên ku ne li wir bûn îcad bike - carinan xelet, carinan ecêb (SRGAN, ESRGAN)

GANek dikare wê tûjiya hêjayî nefesê bide we. Ew dikare çavnebariyek zêde bide mijara portreya we. Ji ber vê yekê… şerên xwe hilbijêrin 😬

3) Bilindkirina li ser bingeha belavbûnê (karta çolê ya afirîner) 🌫️➡️🖼️

Modelên belavbûnê gav bi gav deng bêbandor dikin û dikarin werin rêber kirin da ku hûrguliyên bi çareseriya bilind (SR3) hilberînin.

Erênî: dikare di hûrguliyên maqûl de pir baş be, nemaze ji bo xebata afirîner
Nerênî: heke mîheng êrîşkar bin, dikare ji nasname/avahîya orîjînal dûr bikeve (SR3)

Ev e cihê ku "bilindkirin" dest pê dike û diguhere "ji nû ve xeyalkirinê". Carinan tam ew tiştê ku hûn dixwazin e. Carinan ne wusa ye.

4) Bilindkirina vîdyoyê bi hevgirtina demkî 🎞️

Zêdekirina pîvana vîdyoyê pir caran mantiqa hişmend a tevgerê zêde dike:

Ji bo stabîlkirina hûrguliyan çarçoveyên cîran bikar tîne (BasicVSR (CVPR 2021))
Hewl dide ku ji lerizîn û xêzkirina berhemên xaç dûr bisekine
Pir caran çareseriya super bi denoise û deinterlacing re dike yek (Vîdyoya Topaz)

Eger bilindkirina wêneyê mîna sererastkirina tabloyekê be, bilindkirina vîdyoyê mîna sererastkirina pirtûkek flipbookê ye bêyî ku pozê karakter her rûpelê şeklê xwe biguhezîne. Ku ... ji ya ku xuya dike dijwartir e.

Çima bilindkirina AI carinan sexte xuya dike (û meriv çawa wê ferq dike) 👀🚩

Bilindkirina asta AI bi awayên naskirî têk diçe. Dema ku hûn şablonan fêr bibin, hûn ê wan li her derê bibînin, mîna kirîna otomobîlek nû û ji nişkê ve dîtina wê modelê li her kolanê 😵💫

Hevpar dibêje:

Momkirina çermê li ser rûyan (zêdebûna deng + nermkirina zêde)
Haloyên zêde tûjkirî li dora qiraxan (qada "zêde tûjkirinê" ya klasîk) (interpolasyona Bîkûbîk)
Tekstûrên dubarekirî (dîwarên kerpîç dibin şêweyên kopî-pêvekirî)
Mîkro-berevajîkirina qirçik ku "algorîtma" diqîre
Têkdana nivîsê ku tîp hema bêje dibin tîp (cureyê herî xirab)
Detayên guherbar li cihê ku taybetmendiyên piçûk bi nermî diguherin, nemaze di herikên xebatê yên belavbûnê de (SR3)

Beşa dijwar: carinan ev berhemên dîrokî di nihêrînekê de "çêtir" xuya dikin. Mejiyê we tûjbûnê hez dike. Lê piştî demekê, ew hîs dike ... nebaş e.

Taktîkek baş ew e ku meriv dûr bikeve û kontrol bike ka di mesafeya temaşekirinê ya normal de xwezayî xuya dike an na. Ger tenê di zoomkirina %400 de baş xuya bike, ev ne serkeftinek e, ev hobiyek e 😅

Çawa AI Upscaling dixebite: aliyê perwerdeyê, bêyî serêşa matematîkê 📉🙂

Modelên super-çareseriyê bi gelemperî ji van mercan pêk tê:

Setên daneyan ên cotkirî (têketina kêm-çareseriyê, hedefa bilind-çareseriyê) (Çareseriya Bilind a Wêneyê Bi Bikaranîna Torên Kûr ên Konvolusyonî (SRCNN))
Fonksiyonên windabûnê yên ku ji nû ve avakirinên xelet ceza dikin (SRGAN)

Cureyên windabûnê yên tîpîk:

Windabûna pîkselê (L1/L2)
Rastbûnê teşwîq dike. Dikare encamên hinekî nerm bide.
Windabûna têgihîştinê
Taybetmendiyên kûrtir (wek "ev dişibihe hev") li şûna pîkselên rast berawird dike (Windabûnên Têgihîştinê (Johnson et al., 2016)).
Windakirina Dijberî (GAN)
Realîzmê teşwîq dike, carinan bi bihayê rastbûna rastîn (SRGAN, Generative Adversarial Networks).

Devjeniyek berdewam heye:

Wê li gorî orîjînalê rast bike .
Ji hêla dîtbarî ve xweş

Amûrên cuda li deverên cuda yên wê spektrumê bicîh dibin. Û dibe ku hûn yekê tercîh bikin li gorî ka hûn wêneyên malbatê sererast dikin an jî posterêk amade dikin ku tê de "xweşikbûn" ji rastbûna dadwerî girîngtir e.

Herikînên kar ên pratîkî: wêne, skanên kevin, anime, û vîdyo 📸🧾🎥

Wêne (portre, peyzaj, wêneyên hilberan)

Pratîka çêtirîn bi gelemperî ev e:

Pêşî deng hinekî bêbandor bike (eger pêwîst be)
Bi mîhengên muhafezekar bilind bike
Ger tişt pir nerm xuya bikin (erê, bi rastî) genim lê zêde bikin

Genim wek xwê ye. Zêde xwê şîvê xera dike, lê qet tama wê ne bêtam e 🍟

Skanên kevin û wêneyên pir pêçayî

Ev dijwartir in ji ber ku model dibe ku blokên pêçandinê wekî "tekstûr" bihesibîne.
Biceribînin:

Rakirina an jî rakirina astengkirina berhemên hunerî
Paşê bilind bike
Paşê tûjkirina ronahiyê (ne pir zêde… dizanim, her kes wisa dibêje, lê dîsa jî)

Anime û hunera xêzê

Hunera xêzê ji van sûd werdigire:

Modelên ku qiraxên paqij diparêzin
Kêmkirina halûsînasyona teksturê
Zêdekirina pîvana animeyê pir caran pir xweş xuya dike ji ber ku şekil hêsantir û domdar in. (Bi şans.)

Vîdyo

Vîdyoyê gavên zêde lê zêde dike:

Dengê kêm bike
Deinterlace (ji bo hin çavkaniyan)
Bilind
Nermkirin an jî stabîlîzasyona demkî (BasicVSR (CVPR 2021))
Ji bo hevgirtinê, ji nû ve danasîna genim a vebijarkî

Eger tu hevgirtina demkî ji bîr bikî, tu wê hûrgiliya biriqok dibînî. Gava ku tu wê ferq bikî, tu nikarî wê ji nedîtî ve bihêlî. Mîna kursiyekî qîrîn di odeyeke bêdeng de 😖

Hilbijartina mîhengan bêyî texmînkirina hovane (peleke xapandinê ya piçûk) 🎛️😵💫

Li vir destpêkek ramana baş heye:

Heke rû plastîk xuya dikin,
deng kêm bikin, tûjbûnê kêm bikin, modelek an moda parastina rû biceribîne.
Heke tekstur pir geş xuya dikin,
slayderên "zêdekirina hûrguliyan" an "vegerandina hûrguliyan" kêm bikin, piştî wê genimê nazik lê zêde bikin.
Ger qirax dibiriqin
, tûjkirinê kêm bikin, vebijarkên tepeserkirina halo kontrol bikin.
Heke wêne pir "AI" xuya dike,
bêtir muhafezekar tevbigerin. Carinan gava herî baş tenê ... kêmtir e.

Her wiha: tenê ji ber ku hûn dikarin wê 8 caran mezintir nekin. 2x an 4xek paqij pir caran xala herî baş e. Ji bilî vê, hûn ji modelê dixwazin ku li ser pîkselên we çîrokek fanfîksiyonê binivîse 📖😂

Exlaq, rastbûn, û pirsa dijwar a "rastiyê" 🧭😬

Bilindkirina AI xêzekê nezelal dike:

Restorasyon tê wateya vegerandina tiştê ku li wir bû
Pêşxistin tê wateya lêzêdekirina tiştê ku ne bû

Bi wêneyên kesane re, bi gelemperî baş e (û xweşik e). Bi rojnamegeriyê, delîlên qanûnî, wênekêşiya bijîşkî, an her tiştê ku tê de wefadarî girîng e… divê hûn baldar bin (OSAC/NIST: Rêbernameya Standard ji bo Rêvebiriya Wêneyên Dîjîtal ên Forensîk, Rêbernameyên SWGDE ji bo Analîza Wêneyên Forensîk).

Qanûnek hêsan:

Ger metirsî zêde bin, bilindkirina asta AI-ê wekî mînakek, ne wekî diyarkerek bihesibînin.

Her wiha, eşkerekirin di çarçoveyên pîşeyî de jî girîng e. Ne ji ber ku AI xerab e, lê ji ber ku temaşevan heq dikin bizanin ka hûrgulî ji nû ve hatine çêkirin an hatine girtin. Ev tenê… rêzdar e.

Nîşeyên dawî û kurteyek kurt 🧡✅

Ji ber vê yekê, awayê karê AI Upscaling ev e: model fêr dibin ka hûrguliyên çareseriya bilind çawa bi şablonên çareseriya nizm ve girêdayî ne, dûv re di dema upscaling de pîkselên zêde yên bawerbar pêşbînî dikin ( Fêrbûna Deep ji bo Super-çareseriya Wêneyê: Lêkolînek ). Li gorî malbata modelê (CNN, GAN, belavbûn, vîdyoy-demkî), ew pêşbînî dikare parastî û dilsoz be… an jî wêrek û carinan nelirê 😅

Kurteya bilez

Bilindkirina kevneşopî pîkselan dirêj dike (interpolasyona Bicubic)
Zêdekirina pîvana AI bi karanîna şablonên fêrbûyî hûrguliyên wenda pêşbînî dike (Çareseriya Super a Wêneyê Bi Bikaranîna Torên Kûr ên Konvolusyonî (SRCNN))
Encamên mezin ji modela rast + sînordarkirinê tên
Li vîdyoyê li halo, rûyên mûmî, teksturên dubarekirî û lerizînê temaşe bikin (BasicVSR (CVPR 2021))
Bilindkirina pîvanan pir caran "ji nû ve avakirina maqûl" e, ne rastiyek bêkêmasî ye (SRGAN, ESRGAN)

Heke tu bixwazî, ji min re bêje tu çi nûjen dikî (rû, wêneyên kevin, vîdyo, anime, skankirina nivîsê), û ez ê stratejiyek mîhengan pêşniyar bikim ku ji xefikên hevpar ên "xuyabûna AI" dûr bisekine 🎯🙂

Nimûneyek ji cîhana rastîn: Bilindkirina wêneyên berhemên sûka kevin 📸

Senaryo

Dikaneke piçûk a kamerayên destê duyem 40 wêneyên berheman ji malperek kevin bi firehiya 800px hatine hinardekirin. Xwediyê wê dixwaze wan li ser rûpelek e-bazirganiyê ya nû ji nû ve bikar bîne, ku mezinahiya wêneyê ya pêşniyarkirî 1,600px fireh e.

Pirsgirêk: guhertina mezinahiyê ya asayî kamerayan nerm nîşan dide, lê zêdekirina AI ya êrîşkar dikare destên lastîkî, hejmarên serial û nîşaneyên lensan bi gumanbarî sexte nîşan bide. Ev girîng e ji ber ku kirrûkar berî kirînê xwe dispêrin van hûrguliyan.

Armanc ne ew e ku agahiyên wenda bi awayekî bêkêmasî "sererast werin vegerandin". Armanc ew e ku wêneyên navnîşê yên paqijtir werin afirandin di heman demê de pelên orîjînal berdest bimînin, ji ber ku bilindkirina asta AI hûrguliyên maqûl pêşbînî dike ne ku rastiya garantîkirî.

Tiştê ku pergala kar hewce dike

Wêneyên hilberên orîjînal, bi îdeal guhertoyên herî kêm pêçayî yên berdest

Mezinahiyek derana armanc, wek 2× bilindkirin ji 800px heta 1600px fireh

Amûrek an modelek bi kontrolên cuda ji bo rakirina deng, tûjkirin, û rakirina tiştên neasayî

Lîsteyek kontrolê ya nirxandinê ya hêsan ji bo nivîs, qirax, logo, pêç, bişkok, dendika çerm û şewqdanan

Peldankek ji bo orîjînalan û peldankek cuda ji bo hinardekirinên sererastkirî, ji ber vê yekê tiştek nayê nivîsandin

Nimûneya rênimayan

Dema ku hûn upscaler-a AI-ê diceribînin, vê celeb rêwerzan bikar bînin:

Ji bo navnîşek bazirganiya elektronîkî, vê wêneya hilberê 2 caran mezintir bikin. Şêweya tiştî, cîhê logoyê, nîşankirina lensan, qiraxên bişkokan û tevnvîsa rûyê wê bi qasî ku pêkan nêzîkî orîjînalê bihêlin. Paqijkirina bi zexta nerm, tûjkirina kêm bikar bînin, û ji îcadkirina nivîsên zêde, xêzikan, etîketan, hejmarên rêzê, an hûrguliyên xemilandî dûr bisekinin. Divê wêneya dawîn di mezinahiya rûpela hilberê ya normal de xwezayî xuya bike, ne ku di zoomê 400% de bi awayekî sûnî tûj be.

Çawa wê biceribînin

Berî ku hûn tevahiya koma xwe pêvajo bikin, bi pênc wêneyên tevlihev dest pê bikin:

Wêneyek hilberê paqij bi ronahiyek baş

Wêneyek JPEG-pelçiqandî bi astengiyê

Wêneyek bi nivîsa çapkirî ya piçûk an nîşanên lensê

Wêneyek tarî bi deng di siya de

Wêneyek bi metal an cama refleksîf

Piştî bilindkirinê, her encamek bi ya orîjînal re bi rêjeya %100 û %200 bidin ber hev. Kontrol bikin ka navên marqeyan, dîal, pêç, port û şêwazên teksturê hîn jî li hev dikin. Ger model "hema hema tîpan" an nîşanên rûyê sexte çêbike, mîhenga tûjkirinê an vegerandina hûrguliyan kêm bikin.

Netîce

Encama mînakî: li ser bingeha demjimêrkirina ceribandinek pênc-wêneyî berî û piştî karanîna vê herikîna kar.

Paqijkirina destî û guhertina mezinahiyê ji bo her wêneyekî nêzîkî 9 hûrdeman, an jî ji bo pênc wêneyan 45 hûrdeman kişand.

Herikîna xebatê ya bi alîkariya AI-ê ji bo her wêneyekî nêzîkî 3 hûrdeman, an jî ji bo pênc wêneyan 15 hûrdeman kişand.

Ev tê texmînkirin ku li ser pênc wêneyan 30 hûrdem têne teserûfkirin, an jî li ser komeke 40 wêneyan nêzîkî 4 demjimêran têne teserûfkirin.

Encama kontrolkirina kalîteyê: 4 ji 5 wêneyan ji nirxandina yekem derbas bûn. Wêneyek ji ber ku pîvanker nivîsa lensê ya piçûk xirab kir, têk çû, ji ber vê yekê ew bi tûjbûnek kêmtir û bêyî başkirina nivîsê ji nû ve hate hilberandin.

Metrîka hêja li vir ne tenê "tûjtir xuya dike" ye. Ew ev e: çend wêne bêyî hûrguliyên îcadkirî ji nirxandinek li kêleka hev derbas dibin?

Çi dikare xelet biçe

Model dikare toz, blokên JPEG, an xêzikan veguherîne tekstûrên "rastîn".

Nivîsara biçûk dikare bibe nivîseke sexte ku heta ku hûn zoom bikin bawerbar xuya dike.

Pir zêde bêdengî dikare lastîk, çerm, an jî metalê firçekirî wekî mûmî xuya bike.

Tûjkirina bihêz dikare li dora qiraxên hilberê halo çêbike.

Pêvajoya komî dikare xeletiyan veşêre, ji ber vê yekê berî ku her tiştî hinarde bikin, nimûneyek binirxînin.

Ji bo bazirganiya elektronîkî, qaîdeya herî ewledar hêsan e: qet ji bo veşartina zirarê, guhertina rewşê, an jî nîşandana hilberek ji ya heyî nûtir, bilindkirina asta AI bikar neynin.

Xwarineke pratîkî

Bilindkirina AI çêtirîn dixebite dema ku hûn wê wekî gaveke qedandinê ya kontrolkirî dibînin, ne wekî bişkojkek tamîrkirinê ya efsûnî. Mîhengên muhafezekar ên 2× bikar bînin, hûrguliyên ku kirrûbir eleqedar dibin kontrol bikin, û wêneya orîjînal biparêzin da ku guhertoya sererastkirî pêbawer bimîne.

Nimûneyek ji cîhana rastîn: Bilindkirina vîdyoyek perwerdehiyê ya kevin bêyî ku ew bibiriqe

Senaryo

Şîrketeke perwerdehiyê ya biçûk vîdyoyek xwenîşandaneke ewlehiyê ya 7 deqeyî heye ku di sala 2014an de bi 720p tomar kiriye. Naverok hîn jî xwedî nirx e, lê dîmen li ser malpera nû ya şîrketê, nemaze li ser ekranên laptopên mezintir, nerm xuya dikin.

Tîm dixwaze guhertoyek 1080p ya paqijtir bêyî ku ji nû ve were kişandin hinarde bike. Xetere ew e ku bilindkirina tund a AI dikare rûyan mîna mûmî nîşan bide, nivîsa li ser tabelayan veguherîne "hema bêjeyan", an jî tekstûrek lerzok ji çarçoveyekê bo çarçoveyekê biafirîne.

Armanc ne ew e ku vîdyo nû xuya bike. Armanc ew e ku ew zelaltir, sabîttir û kêmtir pêçayî be, di heman demê de rûyê mamoste, etîketên hişyariyê, tevgerên destan û hûrguliyên alavan bi yên orîjînal re rast bimînin.

Tiştê ku pergala kar hewce dike

Pelê vîdyoya orîjînal, ne dakêşandinek medyaya civakî ya pêçayî, heke gengaz be

Mezinahiya hinardekirina armanckirî, wek 720p berbi 1080p li şûna ku rasterast berbi 4K ve biçe

Bilindkerek vîdyoyê bi vebijarkên kêmkirina deng, tûjkirin, sererastkirina zextê, û hevgirtina demkî

Klîpek ceribandinê ya kurt bi rû, tevger, nivîs û rûberên hûrgulî

Lîsteyeke kontrolê ya nirxandinê ji bo lerizîn, halo, nivîsa xwar, tevnvîsa rû, û qiraxên guhêrbar

Kopiyek tomarkirî ya vîdyoya orîjînal ji bo berawirdkirin û eşkerekirinê ger hewce be

Nimûneya rênimayan

Berî ku hûn vîdyoyê bi tevahî temaşe bikin, van celeb rêwerzan bikar bînin:

Vîdyoya perwerdehiyê ya 720p bilind bikin bo 1080p. Pêşî li tevgera xwezayî, qiraxên sabît, nivîsa heyî ya xwendî, û tevnvîsa çermê rastîn bidin. Çakkirina zexta nerm û tûjkirina kêm bikar bînin. Nivîsa winda, logo, etîket, xêzik, hûrguliyên rû, an nîşaneyên alavan neafirînin. Ji şewqa çarçove-bi-çarçove dûr bisekinin. Encama dawîn divê di mezinahiya temaşekirina normal de zelaltir xuya bike, dema ku were rawestandin û mezin kirin, ne tûj be ku bi awayekî sûnî were xuyang kirin.

Çawa wê biceribînin

Berî ku hûn pelê 7-deqeyî yê tevahî hilbijînin, nimûneyek 20-çirkeyî hinarde bikin ku tê de ev hene:

Rûyê mamoste dema axaftinê

Destek li seranserê çarçoveyê digere

Etîketeke hişyariyê an nivîseke çapkirî ya biçûk

Rûyekî teksturkirî, wek qumaş, beton, metalê firçekirî, an plastîk

Panê kamerayê an jî her tevgera lerzok

Nimûneyê du caran temaşe bikin: carekê bi leza normal û carekê jî çarçove bi çarçove rawestandî. Bi leza normal, li lerzîna, tekstûra şemitokî, an tevgera neasayî li dora qiraxan bigerin. Dema ku rawestandî ye, guhertoyên orîjînal û yên bilindkirî bidin ber hev da ku bibînin ka nivîs, bişkok, amûr û taybetmendiyên rû hîn jî li hev dikin an na.

Netîce

Encama mînakî: li ser bingeha demjimêrkirina klîpek ceribandinê ya 20-çirkeyî û dûv re sepandina heman mîhengan li ser vîdyoyek 7-deqeyî.

Karê destanî yê "guherandina mezinahî û tûjkirinê" bi qasî 35 hûrdeman dom kir, tevî hinardekirin û nirxandinê, lê di encamê de li ser porê mamoste biriqînek berbiçav û li dora nîşanên ewlehiyê haloyek nîşan da.

Herikîna xebatê ya bi alîkariya AI-ê nêzîkî 55 hûrdeman dom kir, tevî hinardekirina ceribandinê, lê pirsgirêkên nirxandinê ji 8 pirsgirêkên berbiçav di hinardekirina yekem de bo 2 pirsgirêkên biçûk di hinardekirina dawî de kêm kir.

Guhertoya dawî ji 12 kontrolên lîsteya nirxandinê 10 ji wan derbas kir. Du pirsgirêkên mayî nermbûneke sivik a nivîsa paşxaneyê û dengekî sivik li quncikekî tarî bûn. Her du jî hatin qebûlkirin ji ber ku mamoste, alav û gavên ewlehiyê ji hêla dîtbarî ve lihevhatî man.

Metrîka watedar li vir ne "bi destxistina 1080p" e. Ew ev e: çend saniyeyên vîdyoyê di dema lîstina normal de kêşeyên baldar nîşan didin?

Çi dikare xelet biçe

Model dikare blokên kompresyonê tûj bike û wan wekî tekstûrek rastîn xuya bike.

Nivîsa xweşik dikare xwebawertir xuya bike lê kêmtir rast be.

Ger denoise pir zêde be, rû dikarin pir nerm bibin.

Ger amûr her çarçoveyek pir serbixwe derman bike, qiraxên guhêrbar dikarin bibiriqin.

Hinardekirineke 4K dikare ji hinardekirineke 1080p ya sînorkirî xirabtir xuya bike ji ber ku model neçar e ku pir zêde hûrguliyan îcad bike.

Çewtiya herî mezin ew e ku meriv tenê çarçoveyek rawestandî binirxîne. Divê bilindkirina vîdyoyê di tevgerê de xwezayî xuya bike, ne tenê wekî wêneyek bêliv bandorker be.

Xwarineke pratîkî

Ji bo vîdyoyê, bilindkirina AI çêtirîn dixebite dema ku hûn pêşî beşek kurt biceribînin, bilindkirinê nerm bihêlin, û berî tûjbûnê tevgerê binirxînin. Encamek hinekî nermtir lê sabît bi gelemperî ji guhertoyek zelal ku her gava kesek tevdigere dibiriqe çêtir e.

Pirsên Pir tên Pirsîn

Bilindkirina AI û çawa ew dixebite

Zêdekirina pîvana AI (ku pir caran wekî "super-çareserî" tê binavkirin) bi pêşbînîkirina hûrguliyên çareseriya bilind ên winda ji şablonên ku di dema perwerdeyê de têne fêr kirin, çareseriya wêneyê zêde dike. Li şûna ku tenê pîkselan mîna interpolasyona bîkubî dirêj bike, modelek qirax, tevn, rû û xêzên mîna nivîsê lêkolîn dike, dûv re daneyên pîkselên nû çêdike ku bi wan şablonên fêrbûyî re li hev dikin. Ew kêmtir "rastiyê vedigerîne" û bêtir "texmînek bawerbar dike" ku wekî xwezayî dixwîne.

Zêdekirina AI li hember guhertina mezinahiyê ya bîkubî an kevneşopî

Rêbazên bilindkirina pîvanê yên kevneşopî (wek bîkubî) bi piranî di navbera pîkselên heyî de interpolasyonê dikin, veguherînan bêyî ku hûrguliyên rastîn ên nû biafirînin nerm dikin. Bilindkirina pîvanê ya AI armanc dike ku bi naskirina nîşanên dîtbarî û pêşbînîkirina ka guhertoyên bi çareseriya bilind ên wan nîşanan çawa xuya dikin, avahiya maqûl ji nû ve ava bike. Ji ber vê yekê ye ku encamên AI dikarin bi rengek dramatîk tûjtir xuya bikin, û her weha ew dikarin artefaktan bidin nasîn an hûrguliyên ku di çavkaniyê de tune bûn "îcad bikin".

Çima rû dikarin pir şil an jî pir nerm xuya bikin

Rûyên mûmî bi gelemperî ji rakirina deng û nermkirina êrîşkar a bi tûjkirinê re tên ku tevnûra xwezayî ya çerm ji holê radike. Gelek amûr bi deng û tevnûra nazik re bi heman rengî tevdigerin, ji ber vê yekê "paqijkirin" wêneyek dikare por û hûrguliyên nazik jê bibe. Rêbazek hevpar ew e ku meriv deng û tûjkirinê kêm bike, heke hebe moda parastina rûyê bikar bîne, dûv re piçek dendik ji nû ve bide destpêkirin da ku encam kêmtir plastîk û wênekêştir xuya bike.

Berhemên hevpar ên bilindkirina pîvana AI-ê ku divê meriv li wan temaşe bike

Nîşaneyên tîpîk haloyên li dora qiraxan, şêweyên teksturê yên dubarekirî (wek kerpîçên kopî-paste), mîkro-berevajiya qirçik, û nivîsa ku vediguhere "hema hema tîpan" vedihewîne. Di herikên xebatê yên li ser bingeha belavbûnê de, hûn dikarin li cihê ku taybetmendiyên piçûk bi nermî diguherin, guherîna hûrguliyan jî bibînin. Ji bo vîdyoyê, lerizîn û hûrguliyên li seranserê çarçoveyan alayên sor ên mezin in. Ger ew tenê di zoomê zêde de baş xuya bike, mîheng muhtemelen pir êrîşkar in.

Çawa GAN, CNN, û bilindkerên belavbûnê di encaman de ji hev cuda dibin

Super-çareseriya li ser bingeha CNN-ê meyla wê heye ku sabîttir û pêşbînîkirîtir be, lê heke bi tundî were zextkirin, ew dikare "pêvajoyî" xuya bike. Vebijarkên li ser bingeha GAN (bi şêwaza ESRGAN) pir caran tekstûrek û tûjtir çêdikin, lê ew dikarin hûrguliyên xelet, nemaze li ser rûyan, halûsînasyon bikin. Bilindkirina li ser bingeha belavbûnê dikare hûrguliyên xweşik û maqûl çêbike, lê heke mîhengên rêberî an hêzê pir xurt bin, ew dikarin ji avahiya orîjînal dûr bikevin.

Stratejiyeke mîhengên pratîkî ji bo dûrketina ji xuyangeke "pir AI"

Bi awayekî muhafezekar dest pê bikin: berî ku hûn bigihîjin faktorên ekstrem, 2× an 4× bilind bikin. Ger rû plastîk xuya dikin, kêmkirina deng û tûjkirinê kêm bikin û moda hişyariya rû biceribînin. Ger tekstur pir dijwar bibin, başkirina hûrguliyan kêm bikin û paşê lê zêdekirina genimê nazik bifikirin. Ger qirax dibiriqin, tûjkirinê kêm bikin û tepeserkirina halo an jî berhemên hunerî kontrol bikin. Di gelek boriyan de, "kêmtir" bi ser dikeve ji ber ku ew realîzma bawerbar diparêze.

Berî bilindkirinê, birêvebirina skanên kevin an wêneyên JPEG-ê yên bi giranî hatine pêçandin

Wêneyên pêçayî dijwar in ji ber ku model dikarin berhemên blokê wekî tekstûra rastîn bihesibînin û wan zêde bikin. Herikînek xebatê ya hevpar pêşî rakirina berhemên blokê an jî rakirina wan e, dû re bilindkirina pîvanê, û tenê heke pêwîst be tûjkirina ronahiyê ye. Ji bo skankirinê, paqijkirina nerm dikare alîkariya modelê bike ku li şûna zirarê, li ser avahiya rastîn bisekine. Armanc ew e ku "nîşanên tekstûra sexte" kêm bibin da ku bilindker neçar nebe ku ji têketinên dengdar texmînên bi bawerî bike.

Çima bilindkirina vîdyoyê ji bilindkirina wêneyê dijwartir e

Bilindkirina vîdyoyê divê di navbera çarçoveyan de hevgirtî be, ne tenê li ser wêneyekî bêdeng baş be. Ger hûrgulî çarçove-bi-çarçove bilivin, encam zû bala mirov dikişîne. Nêzîkatiyên ku li ser vîdyoyê disekinin, agahdariya demkî ji çarçoveyên cîran bikar tînin da ku ji nû ve avakirinê stabîl bikin û ji şopên şewqdar dûr bisekinin. Gelek herikên kar di heman demê de bêdengî, bêtêlkirin ji bo hin çavkaniyan, û ji nû ve danasîna dendikê ya bijarte jî vedihewîne da ku tevahiya rêzefîlmê hevgirtî hîs bike ne ku bi awayekî sûnî tûj be.

Dema ku bilindkirina AI ne guncaw e an jî xetere ye ku meriv pê bawer be

Bilindkirina asta AI çêtirîn wekî başkirin tê hesibandin, ne wekî delîl. Di çarçoveyên girîng ên wekî rojnamegerî, delîlên qanûnî, wênekirina bijîşkî, an xebata dadwerî de, çêkirina pîkselên "bawerbar" dikare rê li ber şaşiyan veke ji ber ku ew dikare hûrguliyên ku nehatine girtin lê zêde bike. Çarçoveyek ewletir ew e ku meriv wê bi awayekî mînakî bikar bîne û eşkere bike ku pêvajoyek AI hûrguliyan ji nû ve ava kiriye. Ger rastbûn krîtîk be, orîjînalan biparêze û her gav û mîhengê pêvajoyê belge bike.

Referans

arXiv - Fêrbûna Kûr ji bo Super-çareseriya Wêneyê: Anketek - arxiv.org
arXiv - Wêneya Super-Çareseriyê Bi Bikaranîna Torên Kûr ên Konvolusyonî (SRCNN) - arxiv.org
arXiv - Rast-ESRGAN - arxiv.org
arXiv - ESRGAN - arxiv.org
arXiv - SR3 - arxiv.org
Pêşdebirê NVIDIA - NVIDIA DLSS - developer.nvidia.com
AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com
Weqfa Dîtina Komputerê (CVF) Gihîştina Vekirî - BasicVSR: Lêgerîna Pêkhateyên Esasî di Vîdyoya Super-Çareseriyê de (CVPR 2021) - openaccess.thecvf.com
arXiv - Torên Dijber ên Afirîner - arxiv.org
arXiv - SRGAN - arxiv.org
arXiv - Windabûnên Têgihîştî (Johnson et al., 2016) - arxiv.org
GitHub - Depoya Real-ESRGAN (vebijarkên fayansê) - github.com
Wîkîpediya - Interpolasyona Bîkubî - wikipedia.org
Topaz Labs - Wêneya Topaz - topazlabs.com
Topaz Labs - Vîdyoya Topaz - topazlabs.com
Navenda Alîkariyê ya Adobe - Adobe Enhance > Super Resolution - helpx.adobe.com
NIST / OSAC - Rêbernameya Standard ji bo Rêvebiriya Wêneyên Dîjîtal ên Dadwerî (Guhertoya 1.0) - nist.gov
SWGDE - Rêbernameyên ji bo Analîza Wêneyên Edlî - swgde.org

AI-ya herî dawî li Dikana Alîkarên AI-ya Fermî bibînin

Çûna nava

Vegere blogê

Çawa AI Upscaling dixebite: fikra bingehîn, bi gotinên rojane 🧩

Çi guhertoyek baş a bilindkirina pîvana AI çêdike? ✅🛠️

Tabloya Berawirdkirinê: Vebijarkên populer ên bilindkirina AI (û ew ji bo çi baş in) 📊🙂

Raza mezin: model nexşerêyekê ji çareseriya nizm ber bi çareseriya bilind fêr dibin 🧠➡️🖼️

Gûz û bolt: di dema texmînkirinê de çi dibe (dema ku hûn asta bilind dikin) ⚙️✨

Malbatên modelên sereke yên ku ji bo bilindkirina AI-ê têne bikar anîn (û çima ew ji hev cuda hîs dikin) 🤖📚

1) çareseriya super a li ser bingeha CNN-ê (karkerê klasîk)

2) Bilindkirina li ser bingeha GAN (bi şêwaza ESRGAN) 🎭

3) Bilindkirina li ser bingeha belavbûnê (karta çolê ya afirîner) 🌫️➡️🖼️

4) Bilindkirina vîdyoyê bi hevgirtina demkî 🎞️

Çima bilindkirina AI carinan sexte xuya dike (û meriv çawa wê ferq dike) 👀🚩

Çawa AI Upscaling dixebite: aliyê perwerdeyê, bêyî serêşa matematîkê 📉🙂

Herikînên kar ên pratîkî: wêne, skanên kevin, anime, û vîdyo 📸🧾🎥

Wêne (portre, peyzaj, wêneyên hilberan)

Skanên kevin û wêneyên pir pêçayî

Anime û hunera xêzê

Vîdyo

Hilbijartina mîhengan bêyî texmînkirina hovane (peleke xapandinê ya piçûk) 🎛️😵💫

Exlaq, rastbûn, û pirsa dijwar a "rastiyê" 🧭😬

Nîşeyên dawî û kurteyek kurt 🧡✅

Nimûneyek ji cîhana rastîn: Bilindkirina wêneyên berhemên sûka kevin 📸

Senaryo

Tiştê ku pergala kar hewce dike

Nimûneya rênimayan

Çawa wê biceribînin

Netîce

Çi dikare xelet biçe

Xwarineke pratîkî

Nimûneyek ji cîhana rastîn: Bilindkirina vîdyoyek perwerdehiyê ya kevin bêyî ku ew bibiriqe

Senaryo

Tiştê ku pergala kar hewce dike

Nimûneya rênimayan

Çawa wê biceribînin

Netîce

Çi dikare xelet biçe

Xwarineke pratîkî

Pirsên Pir tên Pirsîn

Bilindkirina AI û çawa ew dixebite

Zêdekirina AI li hember guhertina mezinahiyê ya bîkubî an kevneşopî

Çima rû dikarin pir şil an jî pir nerm xuya bikin

Berhemên hevpar ên bilindkirina pîvana AI-ê ku divê meriv li wan temaşe bike

Çawa GAN, CNN, û bilindkerên belavbûnê di encaman de ji hev cuda dibin

Stratejiyeke mîhengên pratîkî ji bo dûrketina ji xuyangeke "pir AI"

Berî bilindkirinê, birêvebirina skanên kevin an wêneyên JPEG-ê yên bi giranî hatine pêçandin

Çima bilindkirina vîdyoyê ji bilindkirina wêneyê dijwartir e

Dema ku bilindkirina AI ne guncaw e an jî xetere ye ku meriv pê bawer be

Referans

AI-ya herî dawî li Dikana Alîkarên AI-ya Fermî bibînin

Çûna nava

Pirs û Bersîvên Zêde

Zêdekirina mezinahiyê ya bi AI çawa ji rêbazên guhertina mezinahiyê yên kevneşopî cuda ye?

Dema ku ez bilindkirina AI-ê bikar tînim, divê ez li çi artefaktên hevpar binêrim?

Çima rû carinan piştî bilindkirinê pir nerm an nerealîst xuya dikin?

Ger piştî bikaranîna bilindkirina scalingê bi AI wêneyên min qirçqirç xuya bikin an jî dengekî zêde jê derkeve, divê ez çi bikim?

Modelên GAN û CNN çawa di encamên bilindkirina AI de têne berawirdkirin?

Gelo bilindkirina asta AI ji bo naveroka vîdyoyê guncaw e, û çi dijwarîyan derdixe holê?

Kengê ne guncaw e ku meriv xwe bispêre bilindkirina AI-ê?

Dema ku wêneyên pir pêçayî bilind dikim, divê ez çi tiştan di hişê xwe de bigirim?