AWS công bố hai khả năng mới để hướng tới một tương lai không có ETL trên AWS

Khách hàng có thể phân tích hàng petabyte dữ liệu giao dịch bằng tích hợp Amazon Aurora zero-ETL với Amazon Redshift, loại bỏ nhu cầu về đường dẫn dữ liệu tùy chỉnh

Khách hàng có thể chạy các ứng dụng Apache Spark trên dữ liệu từ Amazon Redshift bằng cách sử dụng các dịch vụ máy học và phân tích AWS nhanh chóng và dễ dàng hơn nhờ tích hợp Amazon Redshift cho Apache Spark

Dịch vụ web Amazon, Inc. sẽ trình bày tại AWS re. Phát minh ở Las Vegas vào ngày 29 tháng 11 năm 2022. amazon. com, Inc. công ty của (AWS) (NASDAQ. AMZN), hôm nay đã công bố hai tích hợp mới giúp đơn giản hóa việc kết nối và phân tích dữ liệu trên các kho lưu trữ dữ liệu cho khách hàng mà không yêu cầu họ di chuyển dữ liệu giữa các dịch vụ. Với thông báo hôm nay, khách hàng có thể dễ dàng chạy các ứng dụng Apache Spark trên dữ liệu Amazon Redshift bằng cách sử dụng các dịch vụ AWS analytics và machine learning (ML), loại bỏ nhu cầu trích xuất, chuyển đổi và tải (ETL) dữ liệu giữa các dịch vụ để phân tích dữ liệu Amazon Aurora với . g. , Amazon SageMaker, Amazon EMR và AWS Glue)Truy cập aws. amazon. com để tìm hiểu thêm về cách các tính năng mới này hoạt động cùng nhau nhằm giúp khách hàng chuyển đổi sang tương lai AWS với zero-ETL. amazon. com/dữ liệu

Nhiều khách hàng của chúng tôi dựa vào nhiều dịch vụ phân tích và cơ sở dữ liệu AWS để trích xuất giá trị từ dữ liệu của họ và việc chứng minh rằng họ có quyền truy cập vào công cụ phù hợp cho công việc là yếu tố quyết định thành công của họ, theo Swami Sivasubramanian, phó chủ tịch Cơ sở dữ liệu, Phân tích và . Loại bỏ ETL và các nhiệm vụ di chuyển dữ liệu khác cho khách hàng của chúng tôi cho phép họ tập trung vào phân tích dữ liệu và tạo ra những hiểu biết mới cho doanh nghiệp của họ—bất kể quy mô và độ phức tạp của tổ chức và dữ liệu của họ. "Các khả năng mới được công bố hôm nay giúp chúng tôi hướng khách hàng tới một tương lai không có ETL trên AWS, giảm nhu cầu di chuyển hoặc chuyển đổi dữ liệu giữa các dịch vụ theo cách thủ công. "

Câu chuyện tiếp tục

Nền tảng của hầu hết mọi chuyển đổi kỹ thuật số của mọi tổ chức, dữ liệu là trung tâm của mọi ứng dụng, quy trình và quyết định kinh doanh. Tuy nhiên, các hệ thống dữ liệu trong thế giới thực thường trải rộng và phức tạp, với dữ liệu đa dạng phân tán trên nhiều dịch vụ và hệ thống tại chỗ. AWS cung cấp nhiều công cụ chuyên dụng như Amazon Aurora, để lưu trữ dữ liệu giao dịch trong cơ sở dữ liệu quan hệ tương thích với MySQL và PostgreSQL, cũng như Amazon Redshift, để chạy khối lượng công việc phân tích và kho dữ liệu hiệu suất cao trên hàng petabyte dữ liệu. Nhiều tổ chức đang ngồi trên một kho tàng dữ liệu và muốn tối đa hóa giá trị mà họ nhận được từ nó. AWS đã đầu tư vào các chức năng zero-ETL như Amazon Aurora ML và Amazon Redshift ML, cho phép khách hàng tận dụng lợi thế của Amazon SageMaker cho các trường hợp sử dụng do ML cung cấp mà không cần di chuyển dữ liệu giữa các dịch vụ, vì khách hàng cần những công cụ này hoạt động liền mạch với nhau để thực sự tối đa hóa . AWS cũng cung cấp khả năng nhập dữ liệu mượt mà từ các dịch vụ phát trực tuyến AWS (chẳng hạn như Amazon Kinesis và Amazon MSK) vào nhiều kho lưu trữ dữ liệu AWS, chẳng hạn như Amazon Simple Storage Service (Amazon S3) và Amazon OpenSearch Service, để khách hàng có thể phân tích dữ liệu . Thông báo hôm nay dựa trên sức mạnh và khả năng tích hợp sâu của danh mục phân tích và cơ sở dữ liệu của AWS để giúp khách hàng truy cập và phân tích dữ liệu trên các kho lưu trữ dữ liệu trên AWS nhanh hơn, đơn giản hơn và tiết kiệm chi phí hơn

Việc chạy phân tích quy mô petabyte trên dữ liệu giao dịch trong Amazon Aurora gần như theo thời gian thực trở nên dễ dàng hơn nhờ tích hợp Amazon Redshift với Amazon Aurora zero-ETL

Nhu cầu hiểu biết gần như ngay lập tức về dữ liệu giao dịch, chẳng hạn như đặt trước và giao dịch tài chính) tăng lên khi các tổ chức tìm cách hiểu rõ hơn về các động lực kinh doanh cốt lõi và phát triển các chiến lược để tăng doanh thu, giảm chi phí và đạt được lợi thế cạnh tranh. Nhiều tổ chức ngày nay dựa vào giải pháp ba phần để phân tích dữ liệu giao dịch của họ—cơ sở dữ liệu quan hệ để lưu trữ dữ liệu, kho dữ liệu để thực hiện phân tích và đường dẫn dữ liệu tới dữ liệu ETL giữa cơ sở dữ liệu quan hệ và kho dữ liệu. Một số doanh nghiệp duy trì toàn bộ nhóm chỉ để hỗ trợ quá trình này vì đường truyền dữ liệu có thể tốn kém để xây dựng và khó quản lý, yêu cầu các nhà phát triển viết mã tùy chỉnh và liên tục quản lý cơ sở hạ tầng để đảm bảo quy mô đáp ứng nhu cầu. Ngoài ra, thời gian để dữ liệu sẵn sàng phân tích có thể mất nhiều ngày và các sự cố truyền dữ liệu lẻ tẻ có thể làm trì hoãn thêm việc truy cập vào thông tin chi tiết nhạy cảm về thời gian, dẫn đến mất cơ hội kinh doanh

Dữ liệu giao dịch được sao chép tự động và liên tục vài giây sau khi được ghi vào Amazon Aurora và được cung cấp liền mạch trong Amazon Redshift với tích hợp zero-ETL giữa Amazon Aurora và Amazon Redshift. Sau khi có dữ liệu trong Amazon Redshift, khách hàng có thể bắt đầu phân tích dữ liệu đó ngay lập tức và áp dụng các tính năng nâng cao như chia sẻ dữ liệu và Amazon Redshift ML để có được thông tin chuyên sâu toàn diện và mang tính dự báo. Giờ đây, khách hàng có thể sử dụng Amazon Aurora để hỗ trợ nhu cầu cơ sở dữ liệu giao dịch của họ và Amazon Redshift để hỗ trợ phân tích mà không cần xây dựng hoặc duy trì các đường dẫn dữ liệu phức tạp, bằng cách sao chép dữ liệu từ nhiều cụm cơ sở dữ liệu Amazon Aurora vào cùng một phiên bản Amazon Redshift

Việc xây dựng và chạy các ứng dụng Apache Spark trên dữ liệu từ Amazon Redshift trở nên đơn giản hơn với sự trợ giúp của tích hợp Amazon Redshift cho các dịch vụ máy học và phân tích AWS

Hiện nay, AWS hỗ trợ Apache Spark trên Amazon EMR, AWS Glue và Amazon SageMaker với thời gian chạy được AWS tối ưu hóa, tương thích hoàn toàn, nhanh hơn gấp 3 lần so với mã nguồn mở. Apache Spark là một khung xử lý nguồn mở được sử dụng cho khối lượng công việc dữ liệu lớn. Khách hàng thường muốn phân tích dữ liệu từ Amazon Redshift trực tiếp từ các dịch vụ này, điều này buộc họ phải trải qua quá trình tìm kiếm, thử nghiệm và chứng nhận khó khăn, tốn thời gian và chứng nhận trình kết nối bên thứ ba để giúp đọc và ghi dữ liệu giữa môi trường của họ và Amazon . Tất cả những thách thức này làm tăng độ phức tạp trong hoạt động và khiến khách hàng khó sử dụng hết tiềm năng của Apache Spark, ngay cả sau khi họ đã tìm thấy trình kết nối và phải quản lý các vị trí tổ chức dữ liệu trung gian, chẳng hạn như Amazon S3

AWS đã chứng nhận, đóng gói và hỗ trợ tích hợp Amazon Redshift cho Apache Spark, loại bỏ quy trình tốn thời gian và dễ xảy ra lỗi liên quan đến trình kết nối của bên thứ ba. Tích hợp Amazon Redshift cho Apache Spark giúp các nhà phát triển dễ dàng xây dựng và chạy các ứng dụng Apache Spark trên dữ liệu trong Amazon Redshift bằng cách sử dụng các dịch vụ ML và phân tích được AWS hỗ trợ. Các ứng dụng được xây dựng trên Apache Spark có thể bắt đầu chạy truy vấn trên dữ liệu Amazon Redshift chỉ trong vài giây bằng cách sử dụng các khung ngôn ngữ phổ biến (e. g. Các vị trí tổ chức dữ liệu trung gian được quản lý tự động, loại bỏ yêu cầu khách hàng định cấu hình và quản lý các vị trí này trong mã ứng dụng (e. g. , Java, Python, R và Scala). Để bắt đầu tích hợp Amazon Redshift cho Apache Spark, hãy truy cập aws. Amazoncom/redshift/features/integration-for-apache-spark

Theo Jack Lull, nhà khoa học chính của Adobe Acrobat Sign, "Sứ mệnh của Adobe là thay đổi thế giới thông qua trải nghiệm kỹ thuật số và trong thế giới ngày nay, điều đó có nghĩa là có các phân tích có thể cung cấp thông tin chuyên sâu và theo thời gian thực. " Adobe trao quyền cho tất cả mọi người, từ các cá nhân và doanh nghiệp nhỏ đến chính phủ và các thương hiệu toàn cầu, để tạo ra và mang đến những trải nghiệm kỹ thuật số đặc biệt. Với tư cách là khách hàng của Amazon Aurora, "chúng tôi rất vui mừng vì Amazon Aurora hỗ trợ tích hợp zero-ETL với Amazon Redshift, điều này sẽ cung cấp thông tin chi tiết mới và hiệu suất phân tích nhanh hơn khi mức sử dụng của chúng tăng lên—tất cả đều không cần liên tục. "

Nhà cung cấp phần mềm hoạch định nguồn lực doanh nghiệp dành riêng cho ngành Infor là công ty hàng đầu thế giới trong lĩnh vực này. "Tại Infor, chúng tôi sử dụng AWS để xây dựng và triển khai các công cụ hiện đại nhằm giúp khách hàng chuyển đổi hoạt động kinh doanh của họ và đẩy nhanh quá trình đổi mới. Jim Plourde, phó chủ tịch cấp cao phụ trách dịch vụ đám mây của Infor, cho biết: "Chúng tôi rất vui mừng vì Amazon Aurora hỗ trợ tích hợp zero-ETL với Amazon Redshift, điều này sẽ giảm bớt gánh nặng vận hành của chúng tôi bằng cách cung cấp dữ liệu giao dịch từ Amazon Aurora trong Amazon Redshift ở gần . Điều này bao gồm dịch vụ kho dữ liệu được quản lý mới cho dữ liệu đám mây ngành của khách hàng của chúng tôi. Giờ đây, chúng tôi có thể tận dụng hiệu suất của Amazon Aurora làm hệ thống quản lý cơ sở dữ liệu quan hệ đồng thời dễ dàng sử dụng các khả năng phân tích và học máy (ML) của Amazon Redshift cho dịch vụ kho dữ liệu được quản lý mới của mình

Kể từ Thế chiến I, GE Aerospace đã thiết kế, phát triển và sản xuất động cơ phản lực, cũng như các bộ phận và hệ thống của chúng, cho cả máy bay thương mại và quân sự. Theo Alcuin Weidus, kiến trúc sư dữ liệu chính cấp cao của GE Aerospace, các nhà khoa học dữ liệu, kỹ sư và nhà phát triển sử dụng Apache Spark để xây dựng các sản phẩm dữ liệu và chạy khối lượng công việc phân tích trên Amazon EMR, AWS Glue và các nền tảng ML của bên thứ ba được lưu trữ trên AWS. "Amazon Redshift là tâm điểm trong chiến lược của chúng tôi nhằm làm cho dữ liệu cực kỳ dễ truy cập và sử dụng được trong toàn tổ chức của chúng tôi. Chúng tôi đang mong chờ sự tích hợp Apache Spark của Amazon Redshift, điều này sẽ đẩy nhanh quá trình phát triển cho các nhà phát triển của chúng tôi và góp phần vào hiệu suất cũng như tính bảo mật của các ứng dụng

Cung cấp nhiều loại dịch vụ tài chính trong lĩnh vực ngân hàng đầu tư, chứng khoán, quản lý đầu tư và ngân hàng tiêu dùng cho một nhóm khách hàng lớn và đa dạng bao gồm các doanh nghiệp, tổ chức tài chính, chính phủ và cá nhân, The Goldman Sachs Group, Inc. Neema Raphael, giám đốc dữ liệu của Goldman Sachs, cho biết: "Trọng tâm của chúng tôi là cung cấp quyền truy cập dữ liệu tự phục vụ cho tất cả người dùng của chúng tôi. Thông qua Legend, nền tảng quản trị và quản lý dữ liệu nguồn mở của chúng tôi, chúng tôi cho phép người dùng phát triển các ứng dụng tập trung vào dữ liệu và rút ra những hiểu biết sâu sắc dựa trên dữ liệu khi chúng tôi cộng tác trong ngành dịch vụ tài chính. "Với tích hợp Amazon Redshift dành cho Apache Spark, nhóm nền tảng dữ liệu của chúng tôi sẽ có thể truy cập dữ liệu Amazon Redshift bằng một vài bước thủ công—cho phép ETL không mã. Điều này sẽ tăng khả năng của chúng tôi để giúp các kỹ sư tập trung hoàn thiện quy trình làm việc của họ dễ dàng hơn như. Chúng tôi hy vọng sẽ thấy sự cải thiện về hiệu suất ứng dụng và bảo mật được cải thiện vì giờ đây người dùng của chúng tôi có thể dễ dàng truy cập vào dữ liệu gần đây nhất trong Amazon Redshift. "

Giới thiệu về dịch vụ web của Amazon

AWS đã liên tục phát triển các dịch vụ của mình để hỗ trợ hầu như mọi khối lượng công việc trên đám mây và hiện có hơn 200 dịch vụ đầy đủ tính năng dành cho điện toán, lưu trữ, cơ sở dữ liệu, kết nối mạng, phân tích, máy học và trí tuệ nhân tạo (AI), Internet vạn vật (IoT) . Trong hơn 15 năm, AWS là dịch vụ đám mây toàn diện và được sử dụng rộng rãi nhất trên thế giới. Để biết thêm thông tin về AWS, hãy truy cập aws. amazon. com. Hàng triệu khách hàng, bao gồm các doanh nghiệp lớn nhất, công ty khởi nghiệp thành công nhất và các tổ chức chính phủ hàng đầu, phụ thuộc vào AWS để cung cấp năng lượng cho cơ sở hạ tầng của họ và giảm chi phí. amazon. com

Giới thiệu về Amazon

Nỗi ám ảnh của khách hàng hơn là sự tập trung vào đối thủ cạnh tranh, niềm đam mê phát minh, cống hiến cho hoạt động xuất sắc và tư duy dài hạn là những nguyên tắc chỉ đạo của Amazon. Amazon phấn đấu trở thành Công ty lấy khách hàng làm trung tâm nhất trên Trái đất, Nhà tuyển dụng tốt nhất trên Trái đất và Nơi làm việc an toàn nhất trên Trái đất. Đánh giá của khách hàng, Mua sắm bằng 1 cú nhấp chuột, đề xuất được cá nhân hóa, Prime, Fulfillment by Amazon, AWS, Kindle Direct Publishing, Kindle, Career Choice, Fire tablet, Fire TV, Amazon Echo, Alexa, Just Walk Out technology, Amazon Studios và The Climate . com/about và theo dõi @AmazonNews để biết thêm chi tiết

“Sự rộng lớn và phức tạp của dữ liệu mà khách hàng quản lý ngày nay có nghĩa là họ không thể phân tích và khám phá dữ liệu đó bằng một công nghệ đơn lẻ hoặc thậm chí một bộ công cụ nhỏ. Nhiều khách hàng của chúng tôi dựa vào nhiều dịch vụ phân tích và cơ sở dữ liệu AWS để trích xuất giá trị từ dữ liệu của họ và đảm bảo họ có quyền truy cập vào công cụ phù hợp cho công việc là điều quan trọng đối với thành công của họ,” Swami Sivasubramanian, phó chủ tịch Cơ sở dữ liệu, Phân tích và . “Các khả năng mới được công bố hôm nay giúp chúng tôi hướng khách hàng tới một tương lai không có ETL trên AWS, giảm nhu cầu di chuyển hoặc chuyển đổi dữ liệu giữa các dịch vụ theo cách thủ công. Bằng cách loại bỏ ETL và các tác vụ di chuyển dữ liệu khác cho khách hàng của mình, chúng tôi giúp họ thoải mái tập trung vào việc phân tích dữ liệu và thúc đẩy những hiểu biết mới cho doanh nghiệp của họ—bất kể quy mô và độ phức tạp của tổ chức và dữ liệu của họ. ”

Dữ liệu là trung tâm của mọi ứng dụng, quy trình và quyết định kinh doanh và là nền tảng cho quá trình chuyển đổi kỹ thuật số của hầu hết mọi tổ chức. Tuy nhiên, các hệ thống dữ liệu trong thế giới thực thường trải dài và phức tạp, với dữ liệu đa dạng được phân tán trên nhiều dịch vụ và hệ thống tại chỗ. Nhiều tổ chức đang ngồi trên một kho tàng dữ liệu và muốn tối đa hóa giá trị mà họ nhận được từ nó. AWS cung cấp nhiều công cụ chuyên dụng như Amazon Aurora, để lưu trữ dữ liệu giao dịch trong cơ sở dữ liệu quan hệ tương thích với MySQL và PostgreSQL, cũng như Amazon Redshift, để chạy các khối lượng công việc phân tích và lưu trữ dữ liệu hiệu suất cao trên hàng petabyte dữ liệu. Tuy nhiên, để thực sự tối đa hóa giá trị của dữ liệu, khách hàng cần những công cụ này để phối hợp nhịp nhàng với nhau. Đó là lý do AWS đã đầu tư vào các chức năng zero-ETL như Amazon Aurora ML và Amazon Redshift ML, cho phép khách hàng tận dụng lợi thế của Amazon SageMaker cho các trường hợp sử dụng do ML cung cấp mà không cần di chuyển dữ liệu giữa các dịch vụ. Ngoài ra, AWS cung cấp khả năng nhập dữ liệu liền mạch từ các dịch vụ phát trực tuyến AWS (e. g. , Amazon Kinesis và Amazon MSK) vào nhiều kho lưu trữ dữ liệu AWS, chẳng hạn như Amazon Simple Storage Service (Amazon S3) và Amazon OpenSearch Service, để khách hàng có thể phân tích dữ liệu ngay khi có sẵn. Thông báo hôm nay dựa trên sức mạnh và khả năng tích hợp sâu của danh mục phân tích và cơ sở dữ liệu của AWS để giúp khách hàng truy cập và phân tích dữ liệu trên các kho lưu trữ dữ liệu trên AWS nhanh hơn, dễ dàng hơn và tiết kiệm chi phí hơn

Tích hợp Amazon Aurora zero-ETL với Amazon Redshift giúp dễ dàng chạy phân tích quy mô petabyte trên dữ liệu giao dịch trong Amazon Aurora trong thời gian gần với Amazon Redshift

Yêu cầu về thông tin chi tiết gần thời gian thực về dữ liệu giao dịch (e. g. , mua hàng, đặt trước và giao dịch tài chính) phát triển khi các tổ chức tìm cách hiểu rõ hơn về các động lực kinh doanh cốt lõi và phát triển các chiến lược để tăng doanh thu, giảm chi phí và đạt được lợi thế cạnh tranh. Nhiều tổ chức ngày nay dựa vào giải pháp ba phần để phân tích dữ liệu giao dịch của họ—cơ sở dữ liệu quan hệ để lưu trữ dữ liệu, kho dữ liệu để thực hiện phân tích và đường dẫn dữ liệu tới dữ liệu ETL giữa cơ sở dữ liệu quan hệ và kho dữ liệu. Đường ống dữ liệu có thể tốn kém để xây dựng và khó quản lý, yêu cầu các nhà phát triển viết mã tùy chỉnh và liên tục quản lý cơ sở hạ tầng để đảm bảo quy mô đáp ứng nhu cầu. Một số công ty duy trì toàn bộ nhóm chỉ để tạo thuận lợi cho quá trình này. Ngoài ra, có thể mất vài ngày trước khi dữ liệu sẵn sàng để phân tích và các lỗi truyền dữ liệu không liên tục có thể làm trì hoãn việc truy cập vào thông tin chi tiết nhạy cảm về thời gian hơn nữa, dẫn đến cơ hội kinh doanh bị bỏ lỡ

Với tích hợp Amazon Aurora zero-ETL với Amazon Redshift, dữ liệu giao dịch được sao chép tự động và liên tục vài giây sau khi được ghi vào Amazon Aurora và được cung cấp liền mạch trong Amazon Redshift. Sau khi có dữ liệu trong Amazon Redshift, khách hàng có thể bắt đầu phân tích dữ liệu đó ngay lập tức và áp dụng các tính năng nâng cao như chia sẻ dữ liệu và Amazon Redshift ML để có được thông tin chi tiết toàn diện và mang tính dự báo. Khách hàng có thể sao chép dữ liệu từ nhiều cụm cơ sở dữ liệu Amazon Aurora vào cùng một phiên bản Amazon Redshift để thu thập thông tin chi tiết về một số ứng dụng. Giờ đây, khách hàng có thể sử dụng Amazon Aurora để hỗ trợ nhu cầu cơ sở dữ liệu giao dịch của họ và Amazon Redshift để hỗ trợ phân tích mà không cần xây dựng hoặc duy trì các đường dẫn dữ liệu phức tạp

Tích hợp Amazon Redshift cho Apache Spark giúp việc sử dụng các dịch vụ ML và phân tích AWS dễ dàng hơn để xây dựng và chạy các ứng dụng Apache Spark trên dữ liệu từ Amazon Redshift

Nhiều nhà phát triển sử dụng Apache Spark, một khung xử lý nguồn mở được sử dụng cho khối lượng công việc dữ liệu lớn, để hỗ trợ nhiều ứng dụng ML và phân tích. Hiện nay, AWS hỗ trợ Apache Spark trên Amazon EMR, AWS Glue và Amazon SageMaker với thời gian chạy được AWS tối ưu hóa, tương thích hoàn toàn, nhanh hơn gấp 3 lần so với mã nguồn mở. Khách hàng thường muốn phân tích dữ liệu Amazon Redshift trực tiếp từ các dịch vụ này. Điều này yêu cầu họ phải trải qua quy trình tìm kiếm, thử nghiệm và chứng nhận trình kết nối bên thứ ba phức tạp, tốn thời gian để giúp đọc và ghi dữ liệu giữa môi trường của họ và Amazon Redshift. Ngay cả sau khi đã tìm thấy trình kết nối, khách hàng vẫn phải quản lý các vị trí phân tầng dữ liệu trung gian, chẳng hạn như Amazon S3, để đọc và ghi dữ liệu từ và tới Amazon Redshift. Tất cả những thách thức này làm tăng độ phức tạp trong hoạt động và khiến khách hàng khó sử dụng Apache Spark ở mức tối đa

Tích hợp Amazon Redshift cho Apache Spark giúp các nhà phát triển xây dựng và chạy các ứng dụng Apache Spark trên dữ liệu trong Amazon Redshift dễ dàng hơn bằng cách sử dụng các dịch vụ ML và phân tích được AWS hỗ trợ. Tích hợp Amazon Redshift cho Apache Spark được AWS chứng nhận, đóng gói và hỗ trợ, loại bỏ quy trình rườm rà và dễ xảy ra lỗi liên quan đến trình kết nối của bên thứ ba. Các nhà phát triển có thể bắt đầu chạy truy vấn trên dữ liệu Amazon Redshift từ các ứng dụng dựa trên Apache Spark trong vài giây bằng cách sử dụng các khung ngôn ngữ phổ biến (e. g. , Java, Python, R và Scala). Các vị trí tổ chức dữ liệu trung gian được quản lý tự động, giúp khách hàng không cần định cấu hình và quản lý các vị trí này trong mã ứng dụng. Để bắt đầu tích hợp Amazon Redshift cho Apache Spark, hãy truy cập aws. amazon. com/redshift/features/integration-for-apache-spark .

Adobe trao quyền cho tất cả mọi người, từ các cá nhân và doanh nghiệp nhỏ đến các cơ quan chính phủ và các thương hiệu toàn cầu, để tạo và cung cấp trải nghiệm kỹ thuật số đặc biệt. Jack Lull, nhà khoa học chính của Adobe Acrobat Sign cho biết: “Sứ mệnh của Adobe là thay đổi thế giới thông qua trải nghiệm kỹ thuật số và trong thế giới ngày nay, điều đó có nghĩa là có các phân tích có thể cung cấp cả thông tin chi tiết chuyên sâu và theo thời gian thực”. “Là một khách hàng của Amazon Aurora, chúng tôi rất vui mừng vì Amazon Aurora hỗ trợ tích hợp zero-ETL với Amazon Redshift, điều này sẽ cung cấp cho cơ sở khách hàng Acrobat Sign ngày càng tăng của chúng tôi những thông tin chi tiết mới và hiệu suất phân tích nhanh hơn khi mức sử dụng của họ tăng lên—tất cả mà không cần liên tục . ”

Infor là công ty hàng đầu thế giới về phần mềm đám mây doanh nghiệp và các giải pháp hoạch định nguồn lực doanh nghiệp dành riêng cho ngành. “Tại Infor, chúng tôi sử dụng AWS để xây dựng và triển khai các công cụ hiện đại nhằm giúp khách hàng của chúng tôi chuyển đổi hoạt động kinh doanh và thúc đẩy đổi mới. Điều này bao gồm dịch vụ kho dữ liệu được quản lý mới dành cho dữ liệu đám mây trong ngành của khách hàng của chúng tôi, dịch vụ này sẽ giúp khách hàng của chúng tôi đưa ra quyết định nhanh hơn với các phân tích nâng cao và ML,” Jim Plourde, phó chủ tịch cấp cao về Dịch vụ đám mây tại Infor cho biết. “Chúng tôi rất vui vì Amazon Aurora hỗ trợ tích hợp zero-ETL với Amazon Redshift, điều này sẽ giảm bớt gánh nặng hoạt động của chúng tôi bằng cách cung cấp dữ liệu giao dịch từ Amazon Aurora trong Amazon Redshift gần như theo thời gian thực. Giờ đây, chúng tôi có thể hưởng lợi từ hiệu suất của Amazon Aurora dưới dạng hệ thống quản lý cơ sở dữ liệu quan hệ của mình, đồng thời dễ dàng tận dụng khả năng phân tích và ML trong Amazon Redshift cho dịch vụ kho dữ liệu được quản lý mới của chúng tôi. ”

GE Aerospace là nhà cung cấp toàn cầu động cơ phản lực, linh kiện và hệ thống cho máy bay thương mại và quân sự. Công ty đã thiết kế, phát triển và sản xuất động cơ phản lực kể từ Thế chiến I. Alcuin Weidus, kiến trúc sư dữ liệu chính cấp cao tại GE Aerospace cho biết: “Amazon Redshift là tâm điểm trong chiến lược của chúng tôi nhằm làm cho dữ liệu cực kỳ dễ truy cập và sử dụng được trong toàn tổ chức của chúng tôi. “Các nhà khoa học, kỹ sư và nhà phát triển dữ liệu tận dụng Apache Spark để xây dựng các sản phẩm dữ liệu và chạy khối lượng công việc phân tích trên Amazon EMR, AWS Glue và các nền tảng ML của bên thứ ba được lưu trữ trên AWS. Chúng tôi rất vui mừng về việc tích hợp Amazon Redshift cho Apache Spark, điều này sẽ hợp lý hóa quy trình xây dựng của các nhà phát triển của chúng tôi và giúp làm cho các ứng dụng hoạt động hiệu quả và an toàn hơn. ”

Tập đoàn Goldman Sachs, Inc. là một tổ chức tài chính toàn cầu hàng đầu cung cấp một loạt các dịch vụ tài chính về ngân hàng đầu tư, chứng khoán, quản lý đầu tư và ngân hàng tiêu dùng cho một cơ sở khách hàng lớn và đa dạng bao gồm các tập đoàn, tổ chức tài chính, chính phủ và cá nhân. “Trọng tâm của chúng tôi là cung cấp quyền truy cập dữ liệu tự phục vụ cho tất cả người dùng của chúng tôi tại Goldman Sachs. Thông qua Legend, nền tảng quản trị và quản lý dữ liệu nguồn mở của chúng tôi, chúng tôi cho phép người dùng phát triển các ứng dụng tập trung vào dữ liệu và rút ra những hiểu biết sâu sắc dựa trên dữ liệu khi chúng tôi cộng tác trong ngành dịch vụ tài chính,” Neema Raphael, giám đốc dữ liệu của Goldman Sachs cho biết. “Với tích hợp Amazon Redshift dành cho Apache Spark, nhóm nền tảng dữ liệu của chúng tôi sẽ có thể truy cập dữ liệu Amazon Redshift với các bước thủ công tối thiểu—cho phép ETL không mã, điều này sẽ tăng khả năng của chúng tôi để giúp các kỹ sư dễ dàng tập trung vào việc hoàn thiện quy trình làm việc của họ hơn . Chúng tôi hy vọng sẽ thấy sự cải thiện hiệu suất của các ứng dụng và bảo mật được cải thiện vì giờ đây người dùng của chúng tôi có thể dễ dàng truy cập vào dữ liệu mới nhất trong Amazon Redshift. ”

tin tức