Bersiva kurt: Bilindkirina AI bi perwerdekirina modelek li ser wêneyên kêm-çareseriya bilind ên hevberkirî dixebite, dûv re jî wê bikar tîne da ku di dema bilindkirinê de pîkselên zêde yên bawerbar pêşbînî bike. Ger model di perwerdeyê de tekstur an rûyên wekhev dîtibe, ew dikare hûrguliyên bawerbar lê zêde bike; ger ne wisa be, ew dikare di vîdyoyê de artefaktên wekî halo, çermê mûmî, an jî lerizînê "halûsînan" bike.
Xalên sereke:
Pêşbînî : Model hûrguliyên maqûl diafirîne, ne ji nû ve avakirina rastiyê ya garantîkirî ye.
Hilbijartina modelê : CNN bi gelemperî sabîttir in; GAN dikarin tûjtir xuya bikin lê xetera dahênana taybetmendiyan hene.
Kontrolkirina tiştên nedîtî : Li halo, teksturên dubare, "hema bêje tîpan", û rûyên plastîk temaşe bikin.
Stabîlîteya vîdyoyê : Rêbazên demkî bikar bînin, an na hûn ê çirûsk û guheztina çarçove-bi-çarçove bibînin.
Bikaranîna metirsiyên bilind : Ger rastbûn girîng e, pêvajoyê eşkere bikin û encaman wekî mînak bihesibînin.

Te belkî dîtibe: wêneyekî pir biçûk û qirçik vediguhere tiştekî têra xwe zelal ku bêyî tirsê were çapkirin, weşandin, an jî têxe nav pêşkêşiyekê. Ew wekî xapandinê xuya dike. Û - bi awayê herî baş - ew bi rastî jî wisa ye 😅
Ji ber vê yekê, Çawaniya Karê Bilindkirina AI vedigere tiştekî taybetîtir ji "komputer hûrguliyan zêde dike" (pêlên destan) û nêzîkî "modelek li gorî şablonên ku ji gelek mînakan fêr bûye avahiya çareseriya bilind a maqûl pêşbînî dike" ( Deep Learning for Image Super-resolution: A Survey ). Ew gava pêşbînîkirinê tevahiya lîstikê ye - û ji ber vê yekê ye ku bilindkirina AI dikare ecêb xuya bike… an hinekî plastîk… an jî mîna ku pisîka we mûyên zêde mezin kir.
Gotarên ku hûn dikarin piştî vê yekê bixwînin:
🔗 Çawa AI dixebite
Bingehên model, daneyan û texmînkirinê di AI de fêr bibin.
🔗 Çawa AI fêr dibe
Bibînin ka daneyên perwerdeyê û şîrove çawa performansa modelê bi demê re baştir dikin.
🔗 Çawa AI anomalîyan tespît dike
Xalên bingehîn ên qaliban û çawa AI tevgerên neasayî bi lez nîşan dide fêm bikin.
🔗 Çawa AI trendan pêşbînî dike
Rêbazên pêşbînîkirinê yên ku sînyalan destnîşan dikin û daxwaza pêşerojê pêşbînî dikin, bikolin.
Çawa AI Upscaling dixebite: fikra bingehîn, bi gotinên rojane 🧩
Zêdekirina pîvanan tê wateya zêdekirina çareseriyê: bêtir pîksel, wêneyek mezintir. Zêdekirina pîvanan a kevneşopî (wek bîkubîk) bi bingehîn pîkselan dirêj dike û veguheztinan nerm dike ( interpolasyona Bîkubîk ). Baş e, lê ew nikare nû - ew tenê interpolasyonê dike.
Bilindkirina pîvana AI tiştekî wêrektir diceribîne (di cîhana lêkolînê de wekî "super-çareserî" tê zanîn) ( Fêrbûna Deep ji bo Super-çareseriya Wêneyê: Lêkolînek ):
-
Ew li têketina kêm-çareseriyê dinêre
-
Şêweyan nas dike (qirax, tevn, taybetmendiyên rû, xêzên nivîsê, tevnkirina qumaşê…)
-
Pêşbînî dike ka guhertoyek bi çareseriya bilind divê çawa be
-
Daneyên pîkselên zêde çêdike ku li gorî wan şablonan e
Ne "rastiyê bi awayekî bêkêmasî sererast bike", bêtir mîna "texmînek pir bawerbar bike" ( Wêneya Super-Resolution Bi Bikaranîna Torgilokên Kûr ên Konvolusyonî (SRCNN) ). Ger ew hinekî gumanbar xuya bike, hûn ne xelet in - lê di heman demê de ev e sedema ku ew ewqas baş dixebite 😄
Û erê, ev tê vê wateyê ku bilindkirina AI di bingeh de halûsînasyona kontrolkirî ye ... lê bi awayekî hilberîner û rêzgirtina li pîkselan.
Çi guhertoyek baş a bilindkirina pîvana AI çêdike? ✅🛠️
Eger hûn li ser upscaler-ek AI-ê (an jî mîhengek pêşwext) dinirxînin, li vir tiştê ku herî zêde girîng e ev e:
-
Vegerandina hûrgiliyan bêyî zêde pijandinê.
Zêdekirina baş qirçîn û avahîyê zêde dike, ne dengê qirçînok an kunên sexte. -
Disîplîna qiraxan
Xêzên paqij paqij dimînin. Modelên xirab dibin sedema lerizîna qiraxan an jî haleyên tavê. -
Realîzma tekstûrê
Divê por nebe şopa firçeyê. Divê kerpîç nebe mohra qalibekî dubarekirî. -
Birêvebirina deng û zextê
Gelek wêneyên rojane di formata JPEG de têne guherandin. Wêneyek baş a bilindkirinê (upscaler) zirarê zêde nake ( Real-ESRGAN ). -
Hişyariya rû û nivîsê
Rû û nivîs cihên herî hêsan in ji bo dîtina xeletiyan. Modelên baş bi nermî tevdigerin (an jî modên taybetî hene). -
Lihevhatin di navbera çarçoveyan de (ji bo vîdyoyê)
Ger hûrgulî çarçove bi çarçove biçirisin, çavên we dê biqîrin. Zêdekirina pîvana vîdyoyê bi sabîtbûna demkî dijî an dimire ( BasicVSR (CVPR 2021) ). -
Kontrolên watedar
Hûn dixwazin slayderan ku bi encamên rastîn re têkildar bin: kêmkirina deng, paqijkirina şewqê, rakirina tiştên nedîtî, ragirtina dendikan, tûjkirin… tiştên pratîkî.
Qanûnek bêdeng ku derbasdar e: bilindkirina "baştirîn" pir caran ew e ku hûn hema hema ferq nakin. Tenê xuya dike ku we di destpêkê de kamerayek çêtir hebû 📷✨
Tabloya Berawirdkirinê: Vebijarkên populer ên bilindkirina AI (û ew ji bo çi baş in) 📊🙂
Li jêr berawirdkirinek pratîkî heye. Biha bi zanebûn nezelal in ji ber ku amûr li gorî lîsans, pakêt, lêçûnên hesabkirinê û hemî tiştên xweş diguherin.
| Amûr / Rêbaz | Baştirîn ji bo | Atmosfera bihayê | Çima ew dixebite (bi qasî) |
|---|---|---|---|
| Bilindkerên sermaseyê yên bi şêwaza Topaz ( Topaz Photo , Topaz Video ) | Wêne, vîdyo, xebata hêsan | Bi qasî dravî | Modelên giştî yên bihêz + gelek mîhengkirin, bi gelemperî "tenê dixebitin"… bi piranî |
| Taybetmendiyên celebê "Super Resolution" a Adobe ( Adobe Enhance > Super Resolution ) | Wênesaz jixwe di wê ekosîstemê de ne | Abonetî-y | Ji nû ve avakirina hûrgulî ya zexm, bi gelemperî muhafezekar (kêmtir drama) |
| Guhertoyên Real-ESRGAN / ESRGAN ( Real-ESRGAN , ESRGAN ) | DIY, pêşdebir, karên komî | Belaş (lê demdirêj e) | Di hûrguliyên teksturê de pir baş e, heke hûn baldar nebin dikarin li ser rûyan tûj bin |
| Modên bilindkirina pîvanê yên li ser bingeha belavbûnê ( SR3 ) | Karê afirîner, encamên şêwazkirî | Têkel | Dikare hûrguliyên xweşik biafirîne - her weha dikare bêwateyan jî îcad bike, ji ber vê yekê… erê |
| Bilindkirina asta lîstikê (bi şêwaza DLSS/FSR) ( NVIDIA DLSS , AMD FSR 2 ) | Lîstik û pêşkêşkirina demrast | Pakêtkirî | Daneyên tevgerê û pêşiyên fêrbûyî bikar tîne - performansa xweş qezenc dike 🕹️ |
| Xizmetên bilindkirina ewr | Rehetî, serketinên bilez | Pere-li-ser-bikaranînê bidin | Zû + pîvanbar, lê hûn kontrol û carinan jî nazikiyê diguherînin |
| Bilindkerên AI yên li ser vîdyoyê ( BasicVSR , Topaz Video ) | Dîmenên kevin, anime, arşîv | Bi qasî dravî | Hîleyên demkî ji bo kêmkirina lerizînê + modelên vîdyoyê yên taybetî |
| Bilindkirina pîvana telefon/galeriyê ya "aqilmend" | Bikaranîna nefermî | Tê de | Modelên sivik ji bo derana xweş hatine mîheng kirin, ne ji bo bêkêmasiyê (hîn jî bikêrhatî ne) |
Dîtinên taybetmendiyê yên formatkirinê: "Paid-ish" di wê tabloyê de gelek kar dike. Lê hûn fikrê fêm dikin 😅
Raza mezin: model nexşerêyekê ji çareseriya nizm ber bi çareseriya bilind fêr dibin 🧠➡️🖼️
Di dilê piraniya bilindkirina asta AI de, sazûmaneke fêrbûna çavdêrîkirî heye ( Çareseriya Bilind a Wêneyê Bi Bikaranîna Torgilokên Kûr ên Konvolusyonî (SRCNN) ):
-
Bi wêneyên bi çareseriya bilind dest pê bikin ("rastî")
-
Wan kêm bikin bo guhertoyên bi çareseriya nizm ("têketin")
-
Modelek perwerde bike da ku çareseriya bilind a orîjînal ji çareseriya nizm ji nû ve ava bike
Bi demê re, model têkiliyên wekî:
-
"Ev cureyê nezelaliya li dora çavan bi gelemperî ji bo kirpikan e"
-
"Ev koma pixelan pir caran nivîsa serif nîşan dide"
-
"Ev gradyana qiraxê dişibihe xêzek banî, ne dengek bêserûber"
Ew ne jiberkirina wêneyên taybetî ye (bi wateya hêsan), ew fêrbûna avahiya îstatîstîkî ye ( Fêrbûna Deep for Image Super-resolution: A Survey ). Li wê mîna fêrbûna rêzimana tekstur û qiraxan bifikirin. Ne rêzimana helbestê, bêtir mîna… rêzimana destnivîsa IKEA 🪑📦 (metafora nebaş, lê têra xwe nêzîk).
Gûz û bolt: di dema texmînkirinê de çi dibe (dema ku hûn asta bilind dikin) ⚙️✨
Dema ku hûn wêneyek dixin nav upscaler-a AI-ê, bi gelemperî boriyek wekî vê heye:
-
Pêş-pêvajoyê
-
Cihê rengan biguherîne (carinan)
-
Nirxên pîkselan normal bike
-
Heke wêneyê mezin be, perçe bike (kontrolkirina rastiya VRAM 😭) ( Depoya Real-ESRGAN (vebijarkên kabloyê) )
-
-
Derxistina taybetmendiyan
-
Qatên destpêkê qirax, goşe û gradyanan tespît dikin
-
Qatên kûrtir şêwazan tespît dikin: tevn, şekil, pêkhateyên rû
-
-
Dîsaavakirinî
-
Model nexşeyek taybetmendiyên bi çareseriya bilindtir çêdike
-
Dûv re wê vediguherîne derana rastîn a pixel
-
-
Piştî-pêvajoyê
-
Tûjkirina bijarte
-
Dengvedana bijarte
-
Tepeserkirina berhemên bijartî (zengil, halo, astengî)
-
Hûrgiliyek nazik: gelek amûr di kaxizan de asta bilind dikin, dûv re jî dirûtinan tevlihev dikin. Amûrên mezin sînorên kaxizan vedişêrin. Amûrên Meh şopên torê yên lawaz dihêlin ger hûn çavên xwe bizivirînin. Û erê, hûn ê çavên xwe bizivirînin, ji ber ku mirov ji kontrolkirina kêmasiyên piçûk ên bi zoom 300% mîna gremlînên piçûk hez dikin 🧌
Malbatên modelên sereke yên ku ji bo bilindkirina AI-ê têne bikar anîn (û çima ew ji hev cuda hîs dikin) 🤖📚
1) çareseriya super a li ser bingeha CNN-ê (karkerê klasîk)
Torên neural ên konvolusyonî di qalibên herêmî de pir baş in: qirax, tekstur, avahiyên piçûk ( Çareseriya Bilind a Wêneyê Bi Bikaranîna Torên Konvolusyonî yên Kûr (SRCNN) ).
-
Erênî: bilez, aram, kêmtir surprîz
-
Nerênî: eger bi zorê were zextkirin, dikare hinekî "pêvajoyî" xuya bike
2) Bilindkirina li ser bingeha GAN (bi şêwaza ESRGAN) 🎭
GAN (Torgên Dijber ên Afirîner) jeneratorekê perwerde dikin da ku wêneyên bi çareseriya bilind hilberîne ku cudaker nikare wan ji yên rastîn cuda bike ( Torgên Dijber ên Afirîner ).
-
Awantaj: hûrguliyên balkêş, tekstûrek balkêş
-
Nerênî: dikare hûrgiliyên ku ne li wir bûn îcad bike - carinan xelet, carinan ecêb ( SRGAN , ESRGAN )
GANek dikare wê tûjiya hêjayî nefesê bide we. Ew dikare çavnebariyek zêde bide mijara portreya we. Ji ber vê yekê… şerên xwe hilbijêrin 😬
3) Bilindkirina li ser bingeha belavbûnê (karta çolê ya afirîner) 🌫️➡️🖼️
Modelên belavbûnê gav bi gav deng bêbandor dikin û dikarin werin rêber kirin da ku hûrguliyên bi çareseriya bilind ( SR3 ) hilberînin.
-
Erênî: dikare di hûrguliyên maqûl de pir baş be, nemaze ji bo xebata afirîner
-
Nerênî: heke mîheng êrîşkar bin, dikare ji nasname/avahîya orîjînal dûr bikeve ( SR3 )
Ev e cihê ku "bilindkirin" dest pê dike û diguhere "ji nû ve xeyalkirinê". Carinan tam ew tiştê ku hûn dixwazin e. Carinan ne wusa ye.
4) Bilindkirina vîdyoyê bi hevgirtina demkî 🎞️
Zêdekirina pîvana vîdyoyê pir caran mantiqa hişmend a tevgerê zêde dike:
-
Ji bo stabîlkirina hûrguliyan çarçoveyên cîran bikar tîne ( BasicVSR (CVPR 2021) )
-
Hewl dide ku ji lerizîn û xêzkirina berhemên xaç dûr bisekine
-
Pir caran çareseriya super bi denoise û deinterlacing re dike yek ( Vîdyoya Topaz )
Eger bilindkirina wêneyê mîna sererastkirina tabloyekê be, bilindkirina vîdyoyê mîna sererastkirina pirtûkek flipbookê ye bêyî ku pozê karakter her rûpelê şeklê xwe biguhezîne. Ku ... ji ya ku xuya dike dijwartir e.
Çima bilindkirina AI carinan sexte xuya dike (û meriv çawa wê ferq dike) 👀🚩
Bilindkirina asta AI bi awayên naskirî têk diçe. Dema ku hûn şablonan fêr bibin, hûn ê wan li her derê bibînin, mîna kirîna otomobîlek nû û ji nişkê ve dîtina wê modelê li her kolanê 😵💫
Hevpar dibêje:
-
Momkirina çermê li ser rûyan (zêdebûna deng + nermkirina zêde)
-
Haloyên zêde tûjkirî li dora qiraxan (qada "zêde tûjkirinê" ya klasîk) ( interpolasyona Bîkûbîk )
-
Tekstûrên dubarekirî (dîwarên kerpîç dibin şêweyên kopî-pêvekirî)
-
Mîkro-berevajîkirina qirçik ku "algorîtma" diqîre
-
Têkdana nivîsê ku tîp hema bêje dibin tîp (cureyê herî xirab)
-
Detayên guherbar li cihê ku taybetmendiyên piçûk bi nermî diguherin, nemaze di herikên xebatê yên belavbûnê de ( SR3 )
Beşa dijwar: carinan ev berhemên dîrokî di nihêrînekê de "çêtir" xuya dikin. Mejiyê we tûjbûnê hez dike. Lê piştî demekê, ew hîs dike ... nebaş e.
Taktîkek baş ew e ku meriv dûr bikeve û kontrol bike ka di mesafeya temaşekirinê ya normal de xwezayî xuya dike an na. Ger tenê di zoomkirina %400 de baş xuya bike, ev ne serkeftinek e, ev hobiyek e 😅
Çawa AI Upscaling dixebite: aliyê perwerdeyê, bêyî serêşa matematîkê 📉🙂
Modelên super-çareseriyê bi gelemperî ji van mercan pêk tê:
-
Setên daneyan ên cotkirî (têketina kêm-çareseriyê, hedefa bilind-çareseriyê) ( Çareseriya Bilind a Wêneyê Bi Bikaranîna Torên Kûr ên Konvolusyonî (SRCNN) )
-
Fonksiyonên windabûnê yên ku ji nû ve avakirinên xelet ceza dikin ( SRGAN )
Cureyên windabûnê yên tîpîk:
-
Windabûna pîkselê (L1/L2)
Rastbûnê teşwîq dike. Dikare encamên hinekî nerm bide. -
Windabûna têgihîştinê
Taybetmendiyên kûrtir (wek "ev dişibihe hev") li şûna pîkselên rast berawird dike ( Windabûnên Têgihîştinê (Johnson et al., 2016) ). -
Windakirina Dijberî (GAN)
Realîzmê teşwîq dike, carinan bi bihayê rastbûna rastîn ( SRGAN , Generative Adversarial Networks ).
Devjeniyek berdewam heye:
-
Wê li gorî orîjînalê
rast . -
Ji hêla dîtbarî ve xweş
Amûrên cuda li deverên cuda yên wê spektrumê bicîh dibin. Û dibe ku hûn yekê tercîh bikin li gorî ka hûn wêneyên malbatê sererast dikin an jî posterêk amade dikin ku tê de "xweşikbûn" ji rastbûna dadwerî girîngtir e.
Herikînên kar ên pratîkî: wêne, skanên kevin, anime, û vîdyo 📸🧾🎥
Wêne (portre, peyzaj, wêneyên hilberan)
Pratîka çêtirîn bi gelemperî ev e:
-
Pêşî deng hinekî bêbandor bike (eger pêwîst be)
-
Bi mîhengên muhafezekar bilind bike
-
Ger tişt pir nerm xuya bikin (erê, bi rastî) genim lê zêde bikin
Genim wek xwê ye. Zêde xwê şîvê xera dike, lê qet tama wê ne bêtam e 🍟
Skanên kevin û wêneyên pir pêçayî
Ev dijwartir in ji ber ku model dibe ku blokên pêçandinê wekî "tekstûr" bihesibîne.
Biceribînin:
-
Rakirina an jî rakirina astengkirina berhemên hunerî
-
Paşê bilind bike
-
Paşê tûjkirina ronahiyê (ne pir zêde… dizanim, her kes wisa dibêje, lê dîsa jî)
Anime û hunera xêzê
Hunera xêzê ji van sûd werdigire:
-
Modelên ku qiraxên paqij diparêzin
-
Kêmkirina halûsînasyona teksturê
Zêdekirina pîvana animeyê pir caran pir xweş xuya dike ji ber ku şekil hêsantir û domdar in. (Bi şans.)
Vîdyo
Vîdyoyê gavên zêde lê zêde dike:
-
Dengê kêm bike
-
Deinterlace (ji bo hin çavkaniyan)
-
Bilind
-
Nermkirin an jî stabîlîzasyona demkî ( BasicVSR (CVPR 2021) )
-
Ji bo hevgirtinê, ji nû ve danasîna genim a vebijarkî
Eger tu hevgirtina demkî ji bîr bikî, tu wê hûrgiliya biriqok dibînî. Gava ku tu wê ferq bikî, tu nikarî wê ji nedîtî ve bihêlî. Mîna kursiyekî qîrîn di odeyeke bêdeng de 😖
Hilbijartina mîhengan bêyî texmînkirina hovane (peleke xapandinê ya piçûk) 🎛️😵💫
Li vir destpêkek ramana baş heye:
-
Heke rû plastîk xuya dikin,
deng kêm bikin, tûjbûnê kêm bikin, modelek an moda parastina rû biceribîne. -
Heke tekstur pir geş xuya dikin,
slayderên "zêdekirina hûrguliyan" an "vegerandina hûrguliyan" kêm bikin, piştî wê genimê nazik lê zêde bikin. -
Ger qirax dibiriqin
, tûjkirinê kêm bikin, vebijarkên tepeserkirina halo kontrol bikin. -
Heke wêne pir "AI" xuya dike,
bêtir muhafezekar tevbigerin. Carinan gava herî baş tenê ... kêmtir e.
Her wiha: tenê ji ber ku hûn dikarin wê 8 caran mezintir nekin. 2x an 4xek paqij pir caran xala herî baş e. Ji bilî vê, hûn ji modelê dixwazin ku li ser pîkselên we çîrokek fanfîksiyonê binivîse 📖😂
Exlaq, rastbûn, û pirsa dijwar a "rastiyê" 🧭😬
Bilindkirina AI xêzekê nezelal dike:
-
Restorasyon tê wateya vegerandina tiştê ku li wir bû
-
Pêşxistin tê wateya lêzêdekirina tiştê ku ne bû
Bi wêneyên kesane re, bi gelemperî baş e (û xweşik e). Bi rojnamegeriyê, delîlên qanûnî, wênekêşiya bijîşkî, an her tiştê ku tê de wefadarî girîng e… divê hûn baldar bin ( OSAC/NIST: Rêbernameya Standard ji bo Rêvebiriya Wêneyên Dîjîtal ên Forensîk , Rêbernameyên SWGDE ji bo Analîza Wêneyên Forensîk ).
Qanûnek hêsan:
-
Ger metirsî zêde bin, bilindkirina asta AI-ê wekî mînakek , ne wekî diyarkerek bihesibînin.
Her wiha, eşkerekirin di çarçoveyên pîşeyî de jî girîng e. Ne ji ber ku AI xerab e, lê ji ber ku temaşevan heq dikin bizanin ka hûrgulî ji nû ve hatine çêkirin an hatine girtin. Ev tenê… rêzdar e.
Nîşeyên dawî û kurteyek kurt 🧡✅
Ji ber vê yekê, awayê karê AI Upscaling ev e: model fêr dibin ka hûrguliyên çareseriya bilind çawa bi şablonên çareseriya nizm ve girêdayî ne, dûv re di dema upscaling de pîkselên zêde yên bawerbar pêşbînî dikin ( Fêrbûna Deep ji bo Super-çareseriya Wêneyê: Lêkolînek ). Li gorî malbata modelê (CNN, GAN, belavbûn, vîdyoy-demkî), ew pêşbînî dikare parastî û dilsoz be… an jî wêrek û carinan nelirê 😅
Kurteya bilez
-
Bilindkirina kevneşopî pîkselan dirêj dike ( interpolasyona Bicubic )
-
Zêdekirina pîvana AI bi karanîna şablonên fêrbûyî hûrguliyên wenda pêşbînî dike ( Çareseriya Super a Wêneyê Bi Bikaranîna Torên Kûr ên Konvolusyonî (SRCNN) )
-
Encamên mezin ji modela rast + sînordarkirinê tên
-
Li vîdyoyê li halo, rûyên mûmî, teksturên dubarekirî û lerizînê temaşe bikin ( BasicVSR (CVPR 2021) )
-
Bilindkirina pîvanan pir caran "ji nû ve avakirina maqûl" e, ne rastiyek bêkêmasî ye ( SRGAN , ESRGAN )
Heke tu bixwazî, ji min re bêje tu çi nûjen dikî (rû, wêneyên kevin, vîdyo, anime, skankirina nivîsê), û ez ê stratejiyek mîhengan pêşniyar bikim ku ji xefikên hevpar ên "xuyabûna AI" dûr bisekine 🎯🙂
Pirsên Pir tên Pirsîn
Bilindkirina AI û çawa ew dixebite
Zêdekirina pîvana AI (ku pir caran wekî "super-çareserî" tê binavkirin) bi pêşbînîkirina hûrguliyên çareseriya bilind ên winda ji şablonên ku di dema perwerdeyê de têne fêr kirin, çareseriya wêneyê zêde dike. Li şûna ku tenê pîkselan mîna interpolasyona bîkubî dirêj bike, modelek qirax, tevn, rû û xêzên mîna nivîsê lêkolîn dike, dûv re daneyên pîkselên nû çêdike ku bi wan şablonên fêrbûyî re li hev dikin. Ew kêmtir "rastiyê vedigerîne" û bêtir "texmînek bawerbar dike" ku wekî xwezayî dixwîne.
Zêdekirina AI li hember guhertina mezinahiyê ya bîkubî an kevneşopî
Rêbazên bilindkirina pîvanê yên kevneşopî (wek bîkubî) bi piranî di navbera pîkselên heyî de interpolasyonê dikin, veguherînan bêyî ku hûrguliyên rastîn ên nû biafirînin nerm dikin. Bilindkirina pîvanê ya AI armanc dike ku bi naskirina nîşanên dîtbarî û pêşbînîkirina ka guhertoyên bi çareseriya bilind ên wan nîşanan çawa xuya dikin, avahiya maqûl ji nû ve ava bike. Ji ber vê yekê ye ku encamên AI dikarin bi rengek dramatîk tûjtir xuya bikin, û her weha ew dikarin artefaktan bidin nasîn an hûrguliyên ku di çavkaniyê de tune bûn "îcad bikin".
Çima rû dikarin pir şil an jî pir nerm xuya bikin
Rûyên mûmî bi gelemperî ji rakirina deng û nermkirina êrîşkar a bi tûjkirinê re tên ku tevnûra xwezayî ya çerm ji holê radike. Gelek amûr bi deng û tevnûra nazik re bi heman rengî tevdigerin, ji ber vê yekê "paqijkirin" wêneyek dikare por û hûrguliyên nazik jê bibe. Rêbazek hevpar ew e ku meriv deng û tûjkirinê kêm bike, heke hebe moda parastina rûyê bikar bîne, dûv re piçek dendik ji nû ve bide destpêkirin da ku encam kêmtir plastîk û wênekêştir xuya bike.
Berhemên hevpar ên bilindkirina pîvana AI-ê ku divê meriv li wan temaşe bike
Nîşaneyên tîpîk haloyên li dora qiraxan, şêweyên teksturê yên dubarekirî (wek kerpîçên kopî-paste), mîkro-berevajiya qirçik, û nivîsa ku vediguhere "hema hema tîpan" vedihewîne. Di herikên xebatê yên li ser bingeha belavbûnê de, hûn dikarin li cihê ku taybetmendiyên piçûk bi nermî diguherin, guherîna hûrguliyan jî bibînin. Ji bo vîdyoyê, lerizîn û hûrguliyên li seranserê çarçoveyan alayên sor ên mezin in. Ger ew tenê di zoomê zêde de baş xuya bike, mîheng muhtemelen pir êrîşkar in.
Çawa GAN, CNN, û bilindkerên belavbûnê di encaman de ji hev cuda dibin
Super-çareseriya li ser bingeha CNN-ê meyla wê heye ku sabîttir û pêşbînîkirîtir be, lê heke bi tundî were zextkirin, ew dikare "pêvajoyî" xuya bike. Vebijarkên li ser bingeha GAN (bi şêwaza ESRGAN) pir caran tekstûrek û tûjtir çêdikin, lê ew dikarin hûrguliyên xelet, nemaze li ser rûyan, halûsînasyon bikin. Bilindkirina li ser bingeha belavbûnê dikare hûrguliyên xweşik û maqûl çêbike, lê heke mîhengên rêberî an hêzê pir xurt bin, ew dikarin ji avahiya orîjînal dûr bikevin.
Stratejiyeke mîhengên pratîkî ji bo dûrketina ji xuyangeke "pir AI"
Bi awayekî muhafezekar dest pê bikin: berî ku hûn bigihîjin faktorên ekstrem, 2× an 4× bilind bikin. Ger rû plastîk xuya dikin, kêmkirina deng û tûjkirinê kêm bikin û moda hişyariya rû biceribînin. Ger tekstur pir dijwar bibin, başkirina hûrguliyan kêm bikin û paşê lê zêdekirina genimê nazik bifikirin. Ger qirax dibiriqin, tûjkirinê kêm bikin û tepeserkirina halo an jî berhemên hunerî kontrol bikin. Di gelek boriyan de, "kêmtir" bi ser dikeve ji ber ku ew realîzma bawerbar diparêze.
Berî bilindkirinê, birêvebirina skanên kevin an wêneyên JPEG-ê yên bi giranî hatine pêçandin
Wêneyên pêçayî dijwar in ji ber ku model dikarin berhemên blokê wekî tekstûra rastîn bihesibînin û wan zêde bikin. Herikînek xebatê ya hevpar pêşî rakirina berhemên blokê an jî rakirina wan e, dû re bilindkirina pîvanê, û tenê heke pêwîst be tûjkirina ronahiyê ye. Ji bo skankirinê, paqijkirina nerm dikare alîkariya modelê bike ku li şûna zirarê, li ser avahiya rastîn bisekine. Armanc ew e ku "nîşanên tekstûra sexte" kêm bibin da ku bilindker neçar nebe ku ji têketinên dengdar texmînên bi bawerî bike.
Çima bilindkirina vîdyoyê ji bilindkirina wêneyê dijwartir e
Bilindkirina vîdyoyê divê di navbera çarçoveyan de hevgirtî be, ne tenê li ser wêneyekî bêdeng baş be. Ger hûrgulî çarçove-bi-çarçove bilivin, encam zû bala mirov dikişîne. Nêzîkatiyên ku li ser vîdyoyê disekinin, agahdariya demkî ji çarçoveyên cîran bikar tînin da ku ji nû ve avakirinê stabîl bikin û ji şopên şewqdar dûr bisekinin. Gelek herikên kar di heman demê de bêdengî, bêtêlkirin ji bo hin çavkaniyan, û ji nû ve danasîna dendikê ya bijarte jî vedihewîne da ku tevahiya rêzefîlmê hevgirtî hîs bike ne ku bi awayekî sûnî tûj be.
Dema ku bilindkirina AI ne guncaw e an jî xetere ye ku meriv pê bawer be
Bilindkirina asta AI çêtirîn wekî başkirin tê hesibandin, ne wekî delîl. Di çarçoveyên girîng ên wekî rojnamegerî, delîlên qanûnî, wênekirina bijîşkî, an xebata dadwerî de, çêkirina pîkselên "bawerbar" dikare rê li ber şaşiyan veke ji ber ku ew dikare hûrguliyên ku nehatine girtin lê zêde bike. Çarçoveyek ewletir ew e ku meriv wê bi awayekî mînakî bikar bîne û eşkere bike ku pêvajoyek AI hûrguliyan ji nû ve ava kiriye. Ger rastbûn krîtîk be, orîjînalan biparêze û her gav û mîhengê pêvajoyê belge bike.
Referans
-
arXiv - Fêrbûna Kûr ji bo Super-çareseriya Wêneyê: Anketek - arxiv.org
-
arXiv - Wêneya Super-Çareseriyê Bi Bikaranîna Torên Kûr ên Konvolusyonî (SRCNN) - arxiv.org
-
arXiv - Rast-ESRGAN - arxiv.org
-
arXiv - ESRGAN - arxiv.org
-
arXiv - SR3 - arxiv.org
-
Pêşdebirê NVIDIA - NVIDIA DLSS - developer.nvidia.com
-
AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com
-
Weqfa Dîtina Komputerê (CVF) Gihîştina Vekirî - BasicVSR: Lêgerîna Pêkhateyên Esasî di Vîdyoya Super-Çareseriyê de (CVPR 2021) - openaccess.thecvf.com
-
arXiv - Torên Dijber ên Afirîner - arxiv.org
-
arXiv - SRGAN - arxiv.org
-
arXiv - Windabûnên Têgihîştî (Johnson et al., 2016) - arxiv.org
-
GitHub - Depoya Real-ESRGAN (vebijarkên fayansê) - github.com
-
Wîkîpediya - Interpolasyona Bîkubî - wikipedia.org
-
Topaz Labs - Wêneya Topaz - topazlabs.com
-
Topaz Labs - Vîdyoya Topaz - topazlabs.com
-
Navenda Alîkariyê ya Adobe - Adobe Enhance > Super Resolution - helpx.adobe.com
-
NIST / OSAC - Rêbernameya Standard ji bo Rêvebiriya Wêneyên Dîjîtal ên Dadwerî (Guhertoya 1.0) - nist.gov
-
SWGDE - Rêbernameyên ji bo Analîza Wêneyên Edlî - swgde.org