Amazon Redshift’in 23 artısı ve eksisi

Amazon Redshift, tamamen sizin için yönetilen, bulutta bulunan petabayt ölçeğinde bir veri depolama hizmetidir. Size birkaç yüz gigabayt veriyle başlama ve ardından işletmeniz için gerektiği gibi ölçeklendirme fırsatı sunarlar. Bu yapı, müşterileriniz, iş fırsatlarınız ve diğer günlük ihtiyaçlarınız hakkında veri edinerek yeni içgörüler edinmenizi sağlar.

Bir dizi düğüm başlatarak bu fırsatı kullanmaya başlayın. Bunlar, “Amazon Redshift kümesi” olarak bilinir. Kümeyi sağladıktan sonra verileriniz yüklenebilir. Buradan, bilgi paketinizde analitik sorguları çalıştırabilirsiniz. Çoğu şirketin dahili ihtiyaçlar için kullandığı SQL tabanlı araçların aynısını kullanır ve fiziksel konumunuzda barındırmanız gerekmediğinden verilerinize erişimi daha hızlı ve daha güvenli hale getirir.

Yazma sırasında Amazon, tüm yeni Redshift kullanıcılarına, ihtiyaçlarını karşılayıp karşılamadığını görmek için bu veri ambarı hizmetinin 2 aylık ücretsiz deneme sürümünü sunuyor. Küçük başlarsanız, ücretsiz denemeden sonraki fiyat saatte yalnızca 0,25 ABD dolarından başlar ve depoladığınız her terabayt için yılda yalnızca 250 ABD dolarına düşer. Bu, benzer bir çözümün maliyetinin yaklaşık %10’unu yapar.

Günümüzde hızlı ve ölçeklenebilir veri ambarı çözümleri arıyorsanız, Amazon Redshift’in göz önünde bulundurmanız gereken artıları ve eksileri burada.

Amazon Redshift avantajlarının listesi

1. Bugün mevcut olan türünün en hızlı çözümlerinden biridir.

Verilerinizi yüklemek veya analitik veya raporlama amaçlarıyla sorgulamak söz konusu olduğunda, Redshift’in sunduklarıyla eşleşebilecek daha az sayıda rakip vardır. Verilerinizi inanamayacağınız hızlarda yüklemek için MPP (Kitlesel Paralel İşleme) mimarisini kullanır. Ayrıca, gerektiğinde hızlı erişim için sorgularınızı paralelleştirecek ve birden çok nota dağıtacaktır. Ayrıca bu hizmetle SSD tabanlı veri depolarını kullanma seçeneğiniz de vardır, bu da büyük bir zaman taahhüdü olmadan karmaşık bir sorgu çalıştırmayı mümkün kılar.

2. Yüksek performanslı bir depo çözümü edinin.

Redshift’in tasarımı, sahip olduğunuz veri yükleme gereksinimlerine ek olarak yedekleme ve geri yükleme işlemlerinizde paralelleştirmeden yararlanmanıza olanak tanır. Bu yapı, ne kadar veri depolarsanız depolayın, sorgularınızı ve dağıtımınızı tam olarak optimize etmenize olanak tanıyan verimli veri sıkıştırma oranları sağlar. Bu avantajlar, size sunulan, tekrarlayan veriler için optimize edilmiş sütunlu depolama veritabanı ile mümkün kılınır. Disk üzerindeki G/Ç işlemleri azaltılır, bu da sonuç olarak performansını artırır.

3. Bir makine öğrenimi sürecine erişim sağlayın.

Redshift, sahip olduğunuz iş yüklerine göre maksimum bir değer almanızı sağlamak için makine öğrenimini kullanır. Bunu, gelen sorguların yürütme sürelerini tahmin eden karmaşık algoritmalar kullanarak yapar. Ardından bunları sizin için işleme hızını optimize eden herhangi bir kuyruğa atarsınız. Bu, raporlarınızın veya pano sorgularınızın standart bir yönlendirme yapısı yerine hızlı bir kuyruktan geçtiği ve anında sonuç sağlamak için işlem hızını optimize ettiği anlamına gelir.

4. Sonuçların önbelleğe alınmasını sağlar.

Redshift, yinelenen sorgular olduğunda bir saniyeden daha kısa bir yanıt süresi sağlamak için sonuç önbelleğe almayı da kullanır. Bu yapı sayesinde görselleştirilmiş iş zekası araçları ve tekrarlanan sorgular çalıştıran gösterge tabloları önemli bir performans artışı elde edecek. Bir önceki çalıştırmanın önbelleğe alınmış bir sonuç oluşturup oluşturmadığını belirlemek için önbelleği arar. Varsa ve veriler değişmediyse, sorguyu yeniden çalıştırmak yerine önbelleğe alınan sonucu görürsünüz.

5. Uygulamanın çok kolay olduğunu göreceksiniz.

Amazon Redshift, iş perspektifinden yapılandırmak ve işletmek için günümüzde mevcut olan en kolay veri ambarı çözümlerinden biridir. Tek yapmanız gereken AWS konsolunuzda oturum açmak ve ardından yeni veri ambarınızı dağıtmak için mevcut komutları takip etmektir. O noktada altyapınızı otomatik olarak sağlayacaktır. Çoğaltma ve yedeklemeler de dahil olmak üzere idari görevlerin çoğu da otomatikleştirilmiştir; bu, yönetmek yerine verilerinize odaklanabileceğiniz anlamına gelir. Belirli iş yüklerine uyacak şekilde ayarlamalar da yapabilirsiniz.

6. Üçüncü taraf araçlarla bütünleşir.

Verilerinizi dönüştürmeye ve görselleştirmeye yardımcı olan kapsamlı bir üçüncü taraf satıcı listesiyle çalışarak Redshift ile etkileşimlerinizi iyileştirmeyi seçebilirsiniz. Tümü Amazon ile çalışması garanti edilen sertifikalı çözümlere sahip iş zekası ortakları, veri entegrasyonu uzmanları, sistem entegrasyonu danışmanlığı ve yardımı ile sorgu ve veri modelleme fırsatları vardır.

7. İşletmeniz için karlı bir çözüm olduğunu keşfedeceksiniz.

Küçükten başlamak istiyorsanız, saat başına 0,25 $ zorunlu olmayan ücretten yararlanabilirsiniz. Redshift, peşin maliyet olmadan isteğe bağlı fiyatlandırma sunan türünün tek sağlayıcısıdır. Ancak 3 yıllık bir dönem taahhüt ederseniz, bulut tabanlı veri depolama ihtiyaçlarınız için %75’e varan tasarruf sağlayabilirsiniz. Saatlik ücretiniz, kümenizdeki düğümlerin sayısına ve türüne bağlıdır. Yoğun depolamada bile, mevcut nesil ürünlerin maksimum maliyeti saatte yaklaşık 7 dolardır.

8. Amazon Redshift ile çalışırken düğüm türünüzü seçebilirsiniz.

Amazon Redshift’i seçerseniz veri depolama ihtiyaçlarınızı optimize etmek için kullanılabilecek iki tür düğüm vardır. Yoğun Hesaplama adı verilen ilk seçenek, hızlı CPU’lar, katı hal sürücüleri ve büyük miktarda bellek için yüksek performanslı bir çözüm oluşturmanıza olanak tanır. Daha düşük fiyatlarla daha büyük bir sabit disk sürücüsü (HDD) sunan Yoğun Depolama düğümlerini kullanmak için daha da ölçeklendirebilirsiniz. Düğümler arasında geçiş yapmak veya kümenizi ölçeklendirmek istiyorsanız, işi tamamlamak için tek bir API çağrısı veya konsolunuzdan birkaç tıklama yeterlidir.

9. Verilerinizin tutarlı bir yedeğini sağlar.

Amazon Redshift, verilerinizin ve dosyalarınızın tutarlı bir yedeğini sunar. Ayrıca, arıza veya hasar meydana geldiğinde onları kurtarır. Bu alanda size sunulan alt görevler, bir sürücü veya düğüm arızalansa bile sürekli ve otomatik olan veri kurtarma yardımını içerir. Karşılaştığınız veri kaybı miktarını sınırlamak için bir olağanüstü durum kurtarma yedeklemesine yardımcı olurlar. Verileri geri yükleme, hesabınızı nasıl kurduğunuza bağlı olarak farklı bölgelerden de gerçekleşir. Bu avantajlar, bu hizmetle bulutta depoladığınız ilk perabaytın ötesine geçseniz bile geçerlidir.

10. Amazon Redshift ile uçtan uca şifreleme alın.

Tek yapmanız gereken, geçiş sırasında veri güvenliğini artırmak için parametre ayarı özelliğinizi SSL kullanacak şekilde yapılandırmaktır. Bu veri depolama sistemi, verileriniz beklemedeyken de AES-256 donanım hızlandırmalı şifreleme kullanır. Bekleyen verileriniz için şifrelemeyi seçtiğinizde, sahip olabileceğiniz yedekler de dahil olmak üzere diske yazılan her şey bu şifreleme avantajını alır. Redshift, varsayılan olarak anahtar yönetimini gerçekleştirir.

11. Ağ izolasyonu sunar.

Amazon Redshift’i seçmek, veri deponuzu oluşturan kümelere ağ erişimini kontrol etmek için güvenlik duvarı kurallarınızı yapılandırma avantajı sağlar. Kümelerinizi kendi sanal ağınız üzerinden yalıtmak için Redshift’i Amazon VPC içinde çalıştırabilirsiniz. Daha sonra, verilere sürekli erişimi en üst düzeye çıkarmak için şifreli bir IPsec VPN kullanmak istiyorsanız, bunu mevcut BT altyapınıza bağlayabilirsiniz.

12. Tüm API çağrılarınızı Redshift üzerinden denetleyebilirsiniz.

Amazon Redshift, CloudTrail ile entegre olduğu için sistem üzerinden yapılan tüm API çağrılarını denetleyebilirsiniz. Sorgular, veritabanı değişiklikleri ve bağlantı denemeleri dahil tüm SQL işlemlerinizi kaydeder. Ardından, sistem tablolarında SQL sorguları kullanarak bilgilere erişebilir veya bunları güvenli bir konumda Amazon S3’e indirmeyi seçebilirsiniz. Sistem SOC1, SOC2 ve SOC3 ile uyumludur. Ayrıca PCI DSS Düzey 1 gereksinimlerini de karşılar.

13. AWS analitik ekosistemiyle yerel olarak bütünleşir.

Veri ambarı ihtiyaçlarınız için Amazon Redshift’i seçtiğinizde, onun AWS analitik ekosistemiyle tamamen entegre olduğunu göreceksiniz.

• Verileri ayıklamak, dönüştürmek ve Redshift’e yüklemek için AWS Glue kullanabilirsiniz.

• Gerçek zamanlıya yakın analitik için Amazon Kinesis Data Firehose’u kullanarak akış verilerini yakalayın, dönüştürün ve Redshift’e yükleyin.

• Amazon QuickSight aracılığıyla panolar, görselleştirmeler ve raporlar oluşturun.

DMS hizmetinizin 6 aylık ücretsiz deneme sürümüyle Redshift’e veri aktarım hızınızı artırmak istiyorsanız AWS Database Migration Service’i bile kullanabilirsiniz.

14. Amazon Redshift için çok sayıda eğitim materyaline erişebilirsiniz.

Amazon Redshift belgeleri sayfasına erişirseniz, yeni bir kullanıcı olarak kullanabileceğiniz çeşitli kaynaklar bulacaksınız. Veri depolama ihtiyaçlarınız olduğunda sistemin nasıl yönetileceğine dair eksiksiz bir genel bakış vardır. Kümeler, veritabanı tabloları ve test sorguları oluşturmak için gereken tüm adımlarda size yol gösteren bir “başlangıç” kılavuzuna erişiminiz vardır. Bir küme yönetim kılavuzu, kümeleri nasıl düzgün bir şekilde yöneteceğinizi gösterirken, bir veritabanı geliştirici kılavuzu, veri ambarınızın temelini oluşturan bilgilerin nasıl oluşturulacağına, tasarlanacağına, sorgulanacağına ve sürdürüleceğine ilişkin açıklamalar sağlar.

Amazon Redshift’in Dezavantajları Listesi

1. Sizin tarafınızdan benzersizliği zorlamanızı gerektirir.

Şu anda, Amazon Redshift’in benzersiz dizinler kullanarak veri bütünlüğünü korumanıza yardımcı olmasına olanak tanıyan bir çerçeve mevcut değildir. Veri depolama işleminin sonunda bu yapıdan siz sorumlusunuz. Bu, dizin anahtarının herhangi bir şekilde güvenliğinin ihlal edilip edilmediğini belirlemek için ifadelerinizdeki veya sütunlarınızdaki değerlerin kontrolü olmadığı anlamına gelir.

Bu yapı nedeniyle “doğrulama” ve “benzersiz” kısıtlamalar desteklenmez. Bu, bazı ajanslar için bazı sınırlamalar yaratan, ilan edilemeyeceği anlamına gelir.

2. Yalnızca belirli verilerle paralel yükleme için desteklenir.

Bulut tabanlı veri depolama çözümünüz olarak Redshift’i seçtiğinizde DynamoDB, SE ve Amazon EMR için paralel yükleme desteklenir. Bu yapılar, sorularınız için gerekli olan yüksek hızları sağlayan MPP’yi kullanır. Ancak, verileriniz için başka bir kaynağınız varsa, bu özellik hiç desteklenmez. Verileri Redshift’e yüklemek için ekleri veya JDBC komut dosyalarını kullanmalısınız. Diğer seçeneğiniz, verilerinizi ambara farklı bir kaynaktan yükleyen bir ETL çözümü kullanmak olacaktır.

3. Dağıtım ve sınıflandırmanın anahtarlarını anlamalısınız.

Dağıtım ve sıralama anahtarları, veri depolama ihtiyaçlarınız için Redshift’i seçtiğinizde verilerinizin nasıl dizine alınacağını ve saklanacağını belirler. Bu işlem tüm düğümler için geçerlidir. Bu, bu çözüm aracılığıyla istediğiniz optimize edilmiş performansı oluşturmak için bunları tablolarınızda nasıl düzgün bir şekilde yapılandıracağınıza dair bilgi de dahil olmak üzere, bu anahtarların arkasındaki kavramları sağlam bir şekilde anlamanız gerektiği anlamına gelir.

Her tablo için yalnızca tek bir dağıtım anahtarı olabilir. Daha sonra değiştiremezsiniz, bu da bir karar vermeden önce gelecekteki iş yüklerini tahmin etmeniz gerektiği anlamına gelir. Birincil anahtarlar da bildirilebilir, ancak zorunlu tutulamaz.

4. Canlı uygulama veritabanı olarak çalışmaz.

Amazon Redshift’in önemli miktarda veri içeren sorguları çalıştırma, raporlar çalıştırma, analitiği işleme ve benzerleri konusunda mükemmel bir iş çıkardığını göreceksiniz, ancak canlı web uygulamaları çalıştırmaya çalışıyorsanız bu yine de bir çözüm değildir. Redshift’ten herhangi bir web uygulamasına veri sunuyorsanız, verileri bir önbelleğe alma katmanına girmeniz veya bir Postgres örneğini seçmeniz gerekir.

Bir Redshift eğitim fırsatı sırasında Lars Kamp, katılımcılara bu çözümle yaşadıkları sorunlar hakkında anket yaptı. %91’i sorgulamalarının çok yavaş olduğunu bildirdi. %64’ü yönetim kurullarının da yavaş olduğunu söyledi. %55’i veritabanında neler olduğunu anlamanın zor olduğunu söyledi. Redshift’i olabileceği güçlü araç haline getirmek için bu sorunlara çözüm bulmak zaman alıyor.

5. Verilerinizi bulut tabanlı bir sisteme yerleştiriyorsunuz.

Bulut tabanlı sistemleri çalıştırırken dikkate alınması gereken benzersiz avantajlar ve dezavantajlar vardır. Verilerinizi site dışında üçüncü bir tarafın yönetmesi fiziksel güvenlik endişelerini artırabilirken, aynı zamanda verilerinizin güvenliğini başka birinin eline bırakmış olursunuz.

Bazı şirketler, fikri mülkiyetinin değeri nedeniyle Redshift’i kullanırken gizlilik endişeleri yaşayabilir. Ayrıca, bir ISS’ye erişimin olmaması, bu hizmetlere erişme yeteneğinizi sınırladığından, düşünmeniz gereken bağlantı sorunlarınız da vardır. Ayrıca kesinti olasılığı da vardır, bu da herhangi bir arızanın halka açık olacağı anlamına gelir.

6. Postgre kurulumunuzda biraz geridesiniz.

Amazon Redshift çerçevesi, PostgreSQL 8.0.2’yi temel alır. Bu sürüm şu anda on yıldan daha eski. O zamandan beri birçok alanda belirgin gelişmeler gördü, ancak bu veri depolama çözümünü seçerseniz bu özellikler şu anda kullanılamıyor. Güncellenmiş SQL’den beklediğiniz temel özelliklerin birçoğunun bu sistemde mevcut olmadığını göreceksiniz.

7. Veri entegrasyonu ve taşıma maliyetlerini yönetmelisiniz.

Perabayt düzeyinde bir veri ambarı çözümü ile çalıştığınız için, bu verileri iletmek için ihtiyaç duyacağınız bant genişliği bu projenin ilk aşamalarında dikkate alınmalıdır. Dahili sistemleriniz, bilgileri bulut tabanlı Redshift sistemine göndermeli veya tercih ettiğiniz göndericiden USB sürücüler aracılığıyla AWS’ye göndermelidir. Hâlâ sınırlı veri kullanımıyla çalışan küçük bir işletmeyseniz, tüm verilerinizi depolama için gönderemeyebilirsiniz.

8. Amazon Redshift’te kullanabileceğiniz saklı yordam yoktur.

Veri ambarı ihtiyaçlarınız için Redshift’i kullanmaya karar verdiğinizde, SQL komut dosyalarınızı her seferinde bir deyim olarak ayrıştırmanız ve çalıştırmanız gerekecektir. Bunun nedeni, kullanabileceğiniz saklı yordam olmamasıdır. Etkilenen satırları kontrol eder ve sayar, ardından gerekli sonuçları oluşturmak için sisteminizdeki bazı görünümlere veya tablolara karşı karmaşık bir birleştirme sorgusu çalıştırır. Veritabanı yönetim sistemlerine aşina değilseniz, bu süreçlerin öğrenme eğrisi ortalama bir kişi için oldukça yüksek olacaktır.

9. Gruplar arttıkça performans seviyeleri düşer.

Amazon Redshift’i kullanırken tutarlı sonuçlar elde etmek istiyorsanız en iyi sonuçlar için kümelerinizi %75’in altında tutmalısınız. Kümelerin birden çok sorguyla aşırı yüklenmesine izin verirseniz, performans sorunları da yaşamaya başlarsınız. Bu veri ambarı çözümüyle çalışırken kendinizi 10 veya daha az eşzamanlı sorguyla sınırlamak için elinizden gelenin en iyisini yapın. Bakımınızı veya ağır yüklerinizi bu süreç için öngördüğünüz zaman aralığının dışında kalabilecek sessiz dönemlerde çalıştırmanız gerekecektir.

Uygun fiyatlı ve verimli bir veri depolama çözümü arıyorsanız Amazon Redshift’in artılarını ve eksilerini incelemeniz çok önemli. Bu hizmetle ilgili bazı sınırlamalar vardır, ancak Snowflake gibi bazı rakiplerinden ışık yılı ileride olduğunu da göreceksiniz. Özellikle gerçek zamanlı veri erişimi için özel komut dosyalarına ihtiyacınız varsa, öğrenmesi biraz zaman alır, ancak bu hizmeti kullanan çoğu ajans, doğruluğunun, tutarlılığının ve ölçeklenebilirliğinin daha büyük başarı elde etmek için tam olarak ihtiyaç duydukları şey olduğunu bulmaktadır.