Google, üretken yapay zekâ alanındaki çalışmalarını sürdürerek yeni bir AI aracı olan ImageFX tanıttı. ImageFX, Google’ın şimdiye kadar geliştirdiği en yüksek kalitede görselleri sağlayan ve en gelişmiş metin-görsele modelidir. Bu teknoloji, Google DeepMind’ın öncülük ettiği ve Imagen 2 tarafından desteklenen bir görüntü modeli olan ImageFX ile bir adım ileri taşınmıştır.
ImageFX, kullanıcılara hızlı ve güvenli bir şekilde görüntü oluşturma yeteneği sunan güçlü bir arayüzle birlikte gelmektedir. Ayrıca, mevcut üretken yapay zekâ araçları olan MusicFX ve TextFX de güncellenerek daha güçlü hale getirilmiştir.
Google ImageFX, DeepMind ekibi tarafından geliştirilen bir GenAI görüntü modelidir ve istem tabanlı bir kullanıcı arayüzü ile görüntü oluşturma ve düzenleme imkânı sağlar. Bu özellik, OpenAI’nin DALL-E 3, Midjourney, Meta’nın Imagine with Meta AI ve Microsoft Designer gibi benzer araçlardan farklıdır. ImageFX, kullanıcılara benzer boyutlarda denemeler yapabilmeleri için anahtar kelime önerileri listesi sunarak yaratıcılıklarına ve fikirlerine daha yakın bir deneyim sunar.
İnsan gözü tarafından algılanamayan yeni filigranlarla geliyor!
Google, ImageFX’in istenmeyen kullanımlarını önlemek adına çeşitli tedbirler aldığını iddia ediyor. Bu kapsamda, şiddet içeren, saldırgan veya müstehcen içerik gibi istenmeyen çıktıları sınırlamak amacıyla teknik önlemler uygulandığı belirtiliyor. ImageFX aynı zamanda dünyaca ünlü kişilerle ilgili bilgi istem düzeyinde bir filtreleme özelliğine sahiptir. Güvenlik tedbirlerini artırmak için, Google ImageFX tarafından üretilen görseller dijital bir filigran olan SynthID ile etiketleniyor. Bu filigran, insan gözü tarafından algılanamayacak şekilde tasarlanmıştır ve görsellerin düzenlenmesine veya kırpılmasına karşı koruma sağlar.
Ayrıca, kullanıcıların ImageFX ile oluşturulan görselleri Google arama veya Chrome’da gördüklerinde bunun farkına varmalarını sağlamak adına, “Bu görsel hakkında” bölümüne eklenen bilgiler sayesinde kullanıcılar, görselin Google’ın yapay zekâ araçlarıyla oluşturulup oluşturulmadığını anlayabilirler. Bu özellik, kullanıcılara güvenlik ve şeffaflık sağlama amacını taşırken, Google’ın ImageFX’in etkili ve güvenli bir şekilde kullanılmasını sağlamak için aldığı önlemler arasında yer alıyor.
Yapay zekâ ile görsel oluşturmada yeni soluk!
Imagen 2 modeli, Google’ın ImageFX’in yeni görüntü oluşturma yeteneklerini güçlendirmek üzere sunduğu bir teknoloji olarak öne çıkıyor. Bu model aynı zamanda Bard, Search, Ads, Duet AI in Workspace ve Vertex AI gibi Google’ın çeşitli platformlarında yeni üretken yapay zekâ seçeneklerini destekliyor. Google, Imagen 2’nin yapay zekâ tarafından üretilen en yüksek kalitedeki görselleri sunmada etkili olduğunu vurguluyor. Şirket, Imagen 2’nin görüntülerin yapaylıklardan uzak tutulmasına ve bu tür araçların görüntü oluşturma alanındaki gelişmeleri iyileştirmesine katkıda bulunduğunu belirtiyor.
Google ayrıca, MusicFX ve TextFX de geliştirdiğini duyuruyor. MusicLM modelinde yapılan iyileştirmelerle birlikte daha hızlı müzik üretimi ve yüksek kaliteli ses sağlandığı belirtiliyor. Oluşturulan şarkılar artık 70 saniyeye kadar sürebiliyor. TextFX tarafında ise Google, kullanıcı deneyimini artırmak ve gezinmeyi daha etkili hale getirmek amacıyla güncellemeler yaptığını ifade ediyor. Bu güncellemeler, TextFX’in kullanımını daha kullanıcı dostu ve verimli kılma hedefini taşıyor.
Şuan belli başlı ülkelerde kullanıma açıldı!
Bard’daki Gemini Pro, bugünden itibaren daha geniş bir kullanıcı kitlesine hitap edecek şekilde sunuluyor. Artık 40’tan fazla dilde ve 230’un üzerinde kuzey ülkesinde ve bölgede erişilebilir durumda. Google, Bard platformunda İngilizce görselleri ücretsiz olarak oluşturabilme imkanını bugünden itibaren çoğu ülkedeki kullanıcılara tanıdığını duyurdu. Bu görseller, SynthID filigranları ile donatılacak.
Google aynı zamanda, ImageFX aracını Amerika, Yeni Zelanda, Avustralya ve Kenya’da kullanıma açtı. Ancak, şu an için yalnızca İngilizce dilini destekleyen bu araca sadece bu ülkelerden erişim sağlanabiliyor. Bu, kullanıcıların ImageFX’in sunduğu özellikleri deneyimleyebilmeleri için geçerli bir durumdur.