Fotoğraflardan nesneleri çıkarmanız mı gerekiyor? Tam olarak hangi parça bunu yapıyor
Yakın zamanda Facebook Research tarafından piyasaya sürülen Share Anything, bilgisayar görüşüne dalmış çoğu kişinin göz korkutucu bulduğu bir şeyi yapıyor: bir görüntüdeki hangi piksellerin bir nesneye ait olduğunu güvenilir bir şekilde bilmek. Bunu kolaylaştırmak, yakın zamanda Apache 2.0 lisansı altında yayınlanan Segment Everything Modelinin (SAM) amacıdır.
Sonuçlar harika görünüyor ve oradalar Etkileşimli sunum mevcut SAM’in farklı çalışma yöntemleriyle oynayabilirsiniz. Bir görüntünün üzerine gelip tıklanarak bir şeyler alınabilir veya görüntüler otomatik olarak bölünebilir. Dürüst olmak gerekirse, SAM’in bir görüntüdeki farklı nesneleri maskelemeyi bu kadar zahmetsiz hale getirmesi etkileyici. Bunu mümkün kılan şey makine öğrenimidir ve bunun bir parçası da, sistemin arkasındaki modelin yüksek kaliteli görüntüler ve maskelerden oluşan devasa bir veri kümesi üzerinde eğitilmiş olması ve bu da onu yaptığı işte son derece verimli kılmasıdır.
Görüntü bölümlere ayrıldıktan sonra, bu maskeler, nesne algılama (bir nesnenin ne olduğunu tanımlayan ve sınıflandıran) ve diğer bilgisayarla görme uygulamaları gibi diğer sistemlerle iletişim kurmak için kullanılabilir. Nereye bakacaklarını bilirlerse bu sistem daha güçlü çalışır. Meta AI’dan gelen bu Blog gönderisi, SAM ile nelerin mümkün olduğu hakkında bazı ek ayrıntılara giriyor, tüm ayrıntılar araştırma makalesinde.
Bu tür sistemler, yüksek kaliteli veri kümelerine dayanır. Elbette, hiçbir şey bir yığın gerçek dünya verisinin yerini tutamaz, ancak gerçekte var olmayan otomatikleştirilmiş veriler oluşturmanın ve eyleme geçirilebilir sonuçlar almanın mümkün olduğunu da gördük.