Doğal dil işleme, bilgisayarla görme ve alana özgü bilimler gibi çeşitli alanlar için mevcut olan ücretsiz veri setlerini indirmek için bazı popüler web sitelerine göz atın. Bu nedenle, makine öğrenimi, yapay zeka veya diğer veri bilimi projeleriyle ilgileniyorsanız, bu makale sizin için yararlı olabilir.
Günümüzde dünya her yönden veri merkezli hale geliyor ve dünyadaki her büyük/küçük şirket, işlerini kolaylaştırmak için doğru türde verileri elde etmek için büyük miktarlarda para yatırıyor. Veri dediğimde, bir BMW satın almakla ilgilenen kullanıcı bilgisinden, örneğin New York gibi belirli bir şehirde bulunan köpek sayısına kadar her türlü veriyi kastediyorum.
Bu veriler, paydaşlara pazar senaryosu hakkında bilgi edinme, rakipler hakkında bilgi edinme vb. ve önümüzdeki günlerde dünyayı ele geçirecekti. Bu mühendislik/teknoloji denir Yapay zeka.
Şirketler, ilgili verileri işlemek ve bu verilerden anlamlı içgörüler oluşturmak için yapay zeka mühendislerini/ML mühendislerini/veri bilimcileri işe alır ve karşılığında mühendislere katkıları için yüksek oranda ödeme yapılır. Ama gerçeğe ulaşmanın ne kadar zor olduğunu hiç merak ettiniz mi? milyonlarca veri kullanım durumunuz için ve ardından aynı işlemi . Bilgi toplamak için çok zaman harcanıyor ve bu da çok büyük miktarlarda paranın harcanmasına neden oluyor.
Bir Big M şirketi için bu bir sorun değil, ancak herhangi bir fintech girişimi gibi küçük bir şirket için başlangıçta büyük meblağlar harcamak zorlaşıyor. Pekala, eğer bir öğrenciyseniz veya sadece büyük miktarda veriyi test etmenin gerekli olduğu bir proje üzerinde çalışıyorsanız, o zaman bu makalede bazı kaynaklar sağladık ve bunu da ücretsiz olarak sağladık. Öyleyse, bu web sitelerinden bazılarına bir göz atalım ve kullanım durumumuz için açık kaynaklı veri kümelerini kullanalım.
İndirilecek ücretsiz veri kümelerine sahip en iyi web siteleri
1. Kaggle
Burası, istediğiniz her türlü veriyi elde etmek için AI dünyasında çok ünlü bir yer. Platformun sahibi Google’dır ve size küçükten (MB) büyüğe (GB) kadar milyonlarca veri seti sunar. Tek yapmanız gereken hesabınızı Kaggle’a kaydettirmek ve hepsi bu. Kayıttan sonra, istediğiniz herhangi bir veri türünü indirmekte özgürsünüz. Web sitesi ayrıca veri bilimi meraklıları için çeşitli yarışmalar düzenlemekte ve karşılığında güzel nakit ödüller sunmaktadır. Web sitesine bağlantı
İşte sundukları ücretsiz veri kümelerine birkaç örnek:
- Spotify En İyi 200 Liste (2020-2021) – https://www.kaggle.com/sashankpillai/spotify-top-200-charts-20202021
- Tesla Hisse Senedi Verileri 2016-2021- https://www.kaggle.com/ysthehurricane/tesla-stock-data-20162021
- Son Covid-19 Hindistan Eyalet Verileri- https://www.kaggle.com/anandhuh/latest-covid19-india-statewise-data
2. UCI Makine Öğrenimi Deposu
Bu web sitesinin sahibi University of California Irvine’dir ve problem bildiriminiz için araştırmayla ilgili etkinlikleri gerçekleştirmek üzere ücretsiz olarak indirilebilen binlerce açık kaynaklı veri seti içerir. Web sitesi, AI alanında iyi bilinir ve alana özel verileri bulmak için en iyilerden biri olarak kabul edilir. Bu web sitesinin bir başka artı noktası da, sunulan veri setlerinin çoğunlukla temizlenmiş olması ve doğrudan modellerini oluşturmak için kullanılabilmesi ve burada hesabınızı kaydetmenize gerek olmamasıdır. Web sitesine bağlantı.
Bu depoda yer alan bazı veri kümesi örnekleri şunlardır:
- Şarap veri kümesi- https://archive.ics.uci.edu/ml/datasets/Wine
- Yürüyüş sınıflandırması veri kümesi- https://archive.ics.uci.edu/ml/datasets/Gait+Classification
- İris veri kümesi- https://archive.ics.uci.edu/ml/datasets/Iris
3. Data.Gov
Bu, kişinin iş gerekçesi için n sayıda veri seti bulabileceği ve gelişmiş yapay zeka modelleri oluşturmak için bunları değiştirebileceği başka bir platformdur. Web sitesi, taşıdığı anlamı anlamak için zaman kaybetmemek için iyi belgelenmiş veriler sağlamasıyla tanınır. Bir veri bilimi meraklısıysanız ve karmaşık makine öğrenimi modelleri oluştururken ellerinizi kirletmek istiyorsanız, bu, Veri Kümelerini ücretsiz olarak keşfetmek için en iyi web sitelerinden biridir. Web sitesine bağlantı.
Burada sunulan bazı ünlü veri kümeleri şunlardır:
- Okul Sistemi Finans Veri Kümesi – https://catalog.data.gov/dataset/annual-survey-of-school-system-finances
- Optik Yoğunlaştırıcılı MWIR Yüksek Çalışma Sıcaklığı Dedektörleri – https://catalog.data.gov/dataset/high-operational-temperature-mwir-detectors-with-optical-concentrators
4. Github Ücretsiz Veri Kümeleri
Bu, kaliteli verilerin yanı sıra önemli bilgiler ve analitik bulabileceğiniz en iyi açık kaynaklı platformlardan biridir. Portal, yalnızca milyonlarca veriyi depolamakla kalmayıp, aynı zamanda işiniz için değiştirilebilen ve kullanılabilecek çeşitli programlama kodlarını da depolayan bir kasa işlevi görmesi ile bilinir. Bu web sitesi ayrıca çalışmalarınızı ve verilerinizi başkalarından korumak için çeşitli lisans sertifikaları altında lisanslamanıza olanak tanır. Pek çok tanınmış şirket, güvenliği ve marka değeri (Microsoft’a ait) nedeniyle bu portala güvenmektedir.
Görmek: github.com/awesome-public-datasets
5. Microsoft araştırmasından verileri açın
Microsoft artık birkaç açık kaynaklı projeyi açık bir şekilde desteklemektedir ve ayrıca doğal dil işleme, bilgisayar görüşü ve etki alanına özgü bilimler gibi çeşitli alanlar için indirilmek üzere ücretsiz veri kümeleri sağlamaktadır. AI, ML geliştiricileri veya çeşitli veri araştırmacıları bundan faydalanmış olabilir. Web sitesindeki veri seti dört kategoriye ayrılmıştır: bilgisayar bilimi, sosyal bilimler, fizik ve bilgisayar bilimi.
Kullanıcı şu adresi ziyaret edebilir ve kopyayı indirebilir – msropendata.com
6. Akademik Torrentler
Eh, yasa dışı içerik indirmediğiniz sürece Torrent kullanmak kötü bir şey değildir. Bununla birlikte, burada, çeşitli ücretsiz veri kümelerini açıklamalar, dosya boyutu ve bunları indirmek için bağlantılar ile indirmek için özel bir web sitesi olan Academic Torrents’den bahsediyoruz. Academic Torrent’te bulunan yerleşik bir arama motorunu kullanıyor olsak bile, belirli bir veri kümesini filtreleyebilir ve arayabiliriz. Verilere ek olarak çeşitli ücretsiz kurslar ve makaleler indirebilirsiniz. Ayrıca, büyük miktarda veri nedeniyle, BitTorrent veya başka bir torrent uygulaması aracılığıyla bir veri seti almak çok kolaydır. İşte web sitesi bağlantısı: Akademik torrentler. iletişim
7. Küresel Açık Veri Girişimi
Demografi, ulusal yasalar, hükümet bütçesi, ulusal istatistikler, satın alma ile ilgileniyorsanız; Hava Kalitesi, Ulusal Haritalar; seçim sonuçları ve daha fazlası… bu tür ücretsiz veri setlerini – adlı bir web sitesinden indirmek kolaydır – Küresel Açık Veri Girişimi. Ücretsizdir, böylece herkes bu veri kümelerini projeleri için kullanabilir.
Sonuç – Diğer birkaç ücretsiz veri kümesi kaynağı
Yukarıdakilere bakarak, dünyada hiçbir zaman veri sıkıntısı olmadığı ve doğru bir şekilde araştırılırsa n tane bulunabileceği sonucuna varabiliriz. Başlangıçta büyük miktarlarda para yatırmak gerekli değildir, her zaman maliyetleri en aza indirmeye ve ihtiyaçlarımızı verimli bir şekilde karşılayabilecek alternatifler bulmaya odaklanmalıyız. Bunun dışında araştırmayla ilgili faaliyetlerimizi yürütmek için büyük veri kümeleri sağlayan birçok web sitesi var, bazıları Driven Data, Google Herkese Açık Veri Kümeleri, sağlık personeli için PubMed, vb. Yani bu web sitelerini keşfetmeli ve açık kaynaklı veri kümeleriyle oynamalısınız.