Mesai Saatlerinde
Apache Software Foundation (ASF), geçen günlerde tasarlanmış büyük veri depolama çözümü olan “SQL-on-Hadoop”un yeni versiyonu Apache Tajo’yu duyurdu.
Apache Tajo, depolanan büyük veri setleri üstünde yer alan Hadoop Distributed File System (HDFS)’da ve başka veri kaynaklarındaki düşük güvenlikli ve ölçeklenebilir geçici sorgular, çevrimiçi yığınlar ve veriyi kaynak sistemden yönlendirip uygun olarak düzenleyerek veri ambarına yükleyen ETL (Extreact-Trasform-Load) amacıyla kullanılıyor.
Tajo; SQL standartlarını üst düzeyde destekleyerek ve gelişmiş veri tabanı tekniklerini tekrardan yapılandırarak; dağıtılmış işletimlerin direkt olarak kontrolünü ve veri akışı karşısında sorgu değerlendirme detaylılığı stratejileri ve optimizasyon seçenekleri sunuyor.
Oracle ve PostgreSQL katalog mağaza desteği
Doğrudan JSON dosyası desteği
HBase depolama entegrasyonu (kullanıcıların direkt olarak Tajo aracılığıyla HBase tablolarına erişimine izin)
JDBC uygulamalarının daha basit kullanımı amacıyla tasarlanmış JDBC sürücüsü.
Geliştirilmiş Amazon S3 desteği
Diğer öne çıkan özellikler ise şu şekilde:
Hız ve verimlilik
Tamamen dağıtılmış SQL sorgu işleme motoru
Gelişmiş Sorgu Optimizasyonu
Makul veri seti üstünde interaktif analiz
Ölçeklenebilirlik
Uzun süren sorgular amacıyla hata toleransı ve hareketli programlama
Veri setleri amacıyla ana hafızadan daha geniş çekirdek algoritma
Uyumluluk
ANSI/ISO SQL standardı uygunluğu
Hive MetaStore erişim desteği
JDBC sürücü desteği
CSV, JSON, RCFile, SequenceFile and Parque gibi detaylı dosya formatları desteği
Kolayık
Kullanıcı tanımlı işlevler
Etkileşimli kabuk
Kullanışlı Yedekleme / Geri Yükleme yardımcı programı
Asenkron / Senkron Java API