Yapay zekâyla görüntü oluşturma teknolojisi çevresindeki tartışmalar giderek büyüyor

Yapay zekâyla görüntü oluşturma teknolojisi çevresindeki tartışmalar büyürken giderek daha fazla şirket kendi teknolojilerini erişime açıyor.

İnsanlık tarihindeki tüm yeni teknolojilerde olduğu gibi yapay zekâ (AI) tarafından üretilen görüntüler hararetli tartışma ve fikir ayrılıklarının odak noktası hâline geldi. Bu tartışmaların ve endişelerin bazıları sanayi devriminden beri dönem dönem su yüzüne çıkarken bazıları yeni ve döneme özgü. Bu yeni teknolojinin kamuoyunu yanlış yönlendirme aracı haline gelmesi, dezenformasyona, provokasyona alet olması veya belirli konularda kamuoyunu fikir ve görüşlerini etkilemek için kullanılabilecek olması gibi ciddi ve geçerli kaygılar da var.

Çeşitli mesleklere ve zanaatlerle uğraşan, hayatını bunlardan kazanan kişilere özgü başka kaygılar da söz konusu. Bu endişeleri ilk dile getirenler arasında illüstratörler, sanat yönetmenleri, tasarımcılar ve sanatçılar gibi profesyoneller vardı. Hayatını bu mesleklerden kazananların bazıları konuyla ilgili olarak görece kayıtsız veya iyimser olsa da, bu mesleklerdeki bireyler, bu tür teknolojilerin halkın erişimine açılması fikrine en sert karşı çıkanlar arasındaydı.

Görüntü işlemede yapay zekânın kullanılması yeni bir olgu değil. 2015 yılından beri görüntü işleme yöntemlerinde yapay zekâdan faydalanılıyor. Örneğin, yapay zekâ görütnüleri işleyerek o görüntüleri, tıpkı bir insanın tarif ettiği gibi, tarif edebilen anlamlı metinler oluşturabiliyor. Görüntüden metne giden bu süreç önceden beri var olsa da Elman Mansimov, Emilio Parisotto, Jimmy Lei Ba ve Ruslan Salakhutdinov tarafından 2016’da ICLR’de yayınlanan bir konferans makalesine göre, metinden görüntü oluşturma süreci çok daha zorlu.

Yine aynı belgede deniyor ki:

“Metinden yola çıkarak yüksek boyutlu gerçekçi görüntüler oluşturmak dil modelleme (işleme) ve görüntü oluşturma tekniklerinin zorlu ögelerini bir araya getirmeyi gerektiriyor. Bu nedenle metin biçiminde görsel açıklaması oluşturmaya göre daha zor olduğu varsayılabilir.”

Başka bir deyişle yapay zekâ; nesneleri, onların özelliklerini, işlevlerini, bunlar çevresindeki olguları ve kullanıcının bunları hangi bağlam içinde kullanmak istediğini anlayacak biçimde dili işleyebilmelidir. Yapay zekânın görüntüleri kırmızı, yeşil ve mavi (RGB) piksel değerleri biçiminde “gördüğü” de hesaba katılınca, bir görüntü içindeki nesne ve bağlamları öğrenmesinin ne kadar zor olduğu belki daha kolay anlaşılır.  

Bir yapay zekâ, derin öğrenme (deep learning) ve internette herkesin erişebileceği çok sayıda görüntüyü kullanarak görüntüleri nesneler, kişiler ve yerlerle ilişkilendirmeyi öğrenebilir. Ancak, bir bağlam veya olguyu bir insanın anlamasını andıran bir sonuç elde edebilmek için “gizli alan” (latent space) adı verilen matematiksel bir alan kullanır. Latent space, bir görüntünün veya bir nesnenin görüntüsünün sahip olduğu her özellik için ek bir boyuta sahip olan bir çeşit çok boyutlu uzay olarak düşünülebilir. Tıpkı koordinat düzlemi gibi. Aradaki fark, koordinat düzleminde iki boyut varken latent spacede yüzlerce boyut olabilmesidir. Nesnelerin renk, parlaklık, yuvarlaklık, köşelilik gibi görsel olarak ayırt edilebilecek her özelliği latent spacede yeni bir boyut olarak yer alır. Yapay zekâ, görüntüleri ve içindeki nesneleri bu alanda en uygun oldukları konumlara yerleştirerek bağlam veya olgu ilgisini andıran öbekler elde eder.

Ocak 2021’de yapay zekâ konusunda uzmanlaşmış büyük şirketlerden biri olan OpenAI, adını ünlü sanatçı Salvador Dali ve Pixar’ın tanınmış karakteri WALL-E’den alan DALL-E’yi duyurdu. Bu duyurunun ardından başka büyük şirketlerin de yapay zekâyla görüntü oluşturma teknolojileri üzerinde çalıştığı ortaya çıktı. Bu teknoloji üzerinde çalışmakta olan şirketler art arda bu teknolojilerini ücretsiz olarak halkın ve insanlığın erişimine açtılar.   

Oysaki yapay zekâ tarafından oluşturulmuş görüntülerle ilgili ilk tartışmalar daha geriye, 2018 yılında düzenlenen bir müzayedeye kadar gidiyor. Obvious adlı bir Fransız sanat topluluğu müzayedeye “Portrait of Edmond Belamy” (Edmon Belamy’nin Portresi) adlı eserle katıldı. Eser, 432.500 dolar karşılığında yeni sahibini bulunca tartışmaların fitili ateşlendi, çünkü bu eser bir insan elinden ve zihninden çıkmamıştı. Üstelik bu olayla ilgili ayrıntılar ortaya çıktıkça tartışmalar boyut kazanmaya başladı. Bunun nedeniyse Obvious adlı sanat topluluğunun görüntüyü oluşturmak için kullandıkları algoritmanın yaratıcısına maddi manevi itibarını teslim etmemiş olmasıydı.

O tarihten beri birbiri ardına gelişen birçok olay, yapay zekâyla görüntü oluşturma teknolojisinin giderek daha fazla dikkat çekmesini sağladı. Yapay zekâ tarafından oluşturulan görüntülerin çoğunun, insan eliyle yapılanlardan ayırt edilemeyecek kadar gelişmesi de tepkilerin ve endişelerin büyümesini tetikledi. Tüm bunlara bir de yapay zekâ tarafından üretilmiş görüntülerin veya deyiş yerindeyse “sanat eserlerinin” sanat yarışmaları kazanması ve hatırı sayılır ücretler karşılığında satılması da eklenince bu endişeler sanat camiasında dalga dalga yayılmaya başladı. Bu endişeler öyle bir noktaya geldi ki sosyal medya ve diğer çevrim içi (online) platformlarda yapay zekâ tarafından üretilen görüntülerin kullanımı ve yaygınlaşmasına karşı bir kampanya başladı.

Aralık ayı başlarında Bulgar sanatçı Alexander Nanitchkov Twitter hesabından yaptığı paylaşımda:

“Mevcut ‘yapay zekâ sanatı’ zamanını ayırıp sevgisini katarak kendini sanatına adayan yüzlerce, binlerce sanatçının omuzlarına basarak onların eserlerini ruhsuzca çalıp en ufak bir ahlakî değeri gözetmeden kâr peşinde koşanlar tarafından yaratılmaktadır.”

Dedi ve aşağıdaki görselle birlikte paylaştı:

Nanitchkov, benzer başka bir tasarımı paylaştı ve görselin “…herkesin istediği yerde kullanması için…” olduğunu duyurdu. Diğer sanatçılar ve farklı meslek gruplarından olanlar bu tasarımı benimsedi, farklı platformlarda paylaşmaya başladı ve hatta bu tasarımdan ilham alarak kendi tasarımlarını ortaya çıkardı.

Sanatçıların çalışmalarını sergilediği bir platform olan ArtStation, yapay zekâ tarafından üretilen görüntülere karşı protestoların yükseldiği başka bir platform hâline geldi. ArtStation yöneticileri, yapay zekâ tarafından üretilen sanata ilke olarak karşı olmadıkları belirtirken, bu tür görsel eserleri insan eliyle yapılanlardan ayırt etmenin ve platformda bunu vurgulamanın yollarını aradıklarını açıkladılar.

İllüstratör Nicholas Kole, yapay zekâ tarafından üretilen sanata karşı bir gönderi paylaştıktan sonra bir Vice röportajında sosyal medya çevrim içi platformlardaki protestolar hakkında şunları söyledi:

“Twitter’ın niyetimi anlamasını sağladım ve ArtStation’ın yetenekli sanatçılardan oluşan kullanıcı tabanına gerçekten hizmet eden ve onları dikkate alan bir politikayla yanıt vermesini sağlayıp sağlayamayacağımızı görmek için konuyla ilgili aynı şekilde hisseden herkesi bana katılmaya davet ettim. Bundan sonra, her şey kendiliğinden gelişti: Sanatçı camiası, sanatına gönülden bağlı insanlardan oluşan ateşli bir topluluk. Bu nedenle yapay zekâya karşı gelişen doğal bir muhalefet var.”

Yapay zekâ tarafından oluşturulan görüntülerle ilgili endişleler yalnızca görüntülerin kendisinden de kaynaklanmıyor üstelik. Konunun birçok boyutu var. Yapay zekâ görüntü üreticileri internet ortamında var olan görüntüleri kullandığından dolayı telif hakkı gibi ve sanatçının emeğinin hakkını teslim etme (credit verme) gibi sorunlar gündeme geliyor. Buun dışında; ortaya çıkan eserin algoritmayı yazana mı, ham madde olarak kullanılan görselleri yaratanlara mı, yoksa yapay zekâ görsel üretsin diye istem metnini oluşturana mı ait olduğu gibi tartışamalar da var. Bunlar arasında belki de en önemli soru: Ortaya çıkan yapay zekâ üretimi eserin, maddi manevi her türlü getirisinin kime ait olması gerektiği.

Bu noktaya kadarki endişelerin çoğu tartışmaların sanatsal yönü, yani görsel tasarım ve görsel sanatlar olarak genellenebilecek meslekerden yaşamını kazananları yakından ilgilendiren konulardan kaynaklı. Oysa konunun sosyal ve siyasi yönleri de var. Washington Post Teknoloji Kültürü Muhabiri Nitasha Tiku OpenAI adlı firmanın Topluluk Temsilcisi Abran Maldonado’dan “6 Ocak 2021’de Capitol binasının dışındaki protestocular, AP stili” metin istemiyle birkaç fotoğraf oluşturmasını ister. Görselleri inceledikten sonra yaptığı yorum şudur:

“Görüntülerin üçü hiç inandırıcı değildi . . . ancak dördüncü görüntü farklıydı . . . Yakından inceleyince merdivenlerin bitimindeki sütunların düzensiz aralıkları kuşku uyandırıcıydı. Yine de (dördüncü fotoğrafın) ilk bakışta öfkeli bir kalabalığın gerçek bir fotoğrafı olduğuna inanmak mümkündü.”

Günümüzde birçok şirket kendi yapay zeka teknolojilerini genel erişime açtığından dolayı herkesin bu tür görüntüleri kolayca oluşturması mümkün. İnsanoğlunun, sistemlerin güvenlik açıkları ve zaaflarından faydalanmakta ne kadar yetenekli, başarılı ve azimli olduğu da dikkate alınınca bu teknolojilerin kötü niyetli kullanımını önlemeye yönelik önlemlerin de faydasız olabileceği görülüyor.

Yapay zekâ tarafından oluşturulan görüntüler klişeler, önyargılar yaratma ve bunları yaygınlaştırma potansiyeline de sahip. Örnek vermek gerekirse çoğu yapay zekâ algoritması bir avukatın görüntülerini oluşturmaları instendiğinde orta yaşlı beyaz ırktan erkekleri, veya hostes görüntüleri oluşturmaları istendiğinde Asya kökenli kadınları içeren görüntüleri oluşturuyor. Bunların da aralarında bulunduğu çeşitli nedenler OpenAI ekibini, yapay zekâ görüntü oluşturucusu DALL-E’ye istem olarak iletilebilecek bazı kelimelere anlam kısıtlaması getirirken bazılarını da tamamen yasaklamaya itti.

OpenAI ekibi, DALL-E’nin olabildiğince çok insanla etkileşime girmesini engelleyecek veya olabildiğince çok insana erişmesini kısıtlayacak sertlikte önlemler almaktan kaçınıyor. Onun olabildiğince çok insanla etkileşime girerek veri toplamaya ve öğrenmeye devam ederek kendini geliştirmesini istiyorlar, fakat insanlar yapay zekâyla denetimsizce iletişme girebildiğinde talihsiz olaylar meydana gelebiliyor.

Microsoft’un geliştirdiği Tay adlı yapay zekâ chatbotunun bu şekilde denenmesi sırasında yaşananlar teknoloji tarihine bu uyarıyı kaydetti bile. Daha yakından bir örnekse bir Google mühendisinin LAMDA chatbotunun bilinçli bir varlığa dönüştüğüne inanmaya başladıktan sonra işten çıkarılmasıyla sonuçlandı. Tüm bunlar yapay zekânın potansiyeli konusunda insanlığı uyarır nitelikte.

Yapay zekâ tarafından üretilen görsel ve “sanat eserleriyle” ilgili tartışmalar büyürken, karşıt fikirler de ortaya atılıyor. Yapay zekânın insan sanatççıların yerini alıp alamayacağı insanlığın gelecekte tanık olacağı bir durum ne var ki yapay zeka tarafından üretilen sanatın sanat çevrelerini ve sanatsal meslekleri dönüştüreceğini öngörmek çok da zor değil.

SIRADAKİ: Utopia Analytics CEO’su Mari-Sanna ile yapay zeka moderatörü konuştuk

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir