• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Sas 9.4 high performance analytics   eyal gonen
 

Sas 9.4 high performance analytics eyal gonen

on

  • 526 views

 

Statistics

Views

Total Views
526
Views on SlideShare
338
Embed Views
188

Actions

Likes
0
Downloads
5
Comments
0

1 Embed 188

http://www.miac.com 188

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Sas 9.4 high performance analytics   eyal gonen Sas 9.4 high performance analytics eyal gonen Presentation Transcript

    • SAS 9.4 HIGH-PERFORMANCE ANALYTICS OVERVIEW ® ‫אייל גונן‬ ‫מיה מחשבים‬ C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
    • 9.4 HIGH PERFORMANCE ‫תוכן עניינים‬ ANALYTICS Big Data ‫בעיות‬ • SAS In Memory • SAS In Database • SAS Grid Computing • SAS ‫הדור הבא של משתמשי‬ C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . •
    • ‫מה זה? ‪BIG DATA‬‬ ‫‪ Big Data‬הוא יחסי ולא אבסולוטי - כאשר היקף‬ ‫הנתונים וזמן הניתוח שלהם חורג מיכולות התשתית‬ ‫הקיימת וגבולות הזמן הסביר‬ ‫. ‪C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d‬‬
    • SAS® HIGHPERFORMANCE BIG DATA ‫ לבעיות‬SAS ‫כלי‬ ANALYTICS C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
    • SAS® HIGHPERFORMANCE SAS® IN-MEMORY ANALYTICS ANALYTICS C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
    • ‫‪WHAT? SAS® IN-MEMORY ANALYTICS‬‬ ‫למה זה חשוב‬ ‫פתירת בעיות מורכבות בכמעט זמן אמת‬ ‫הבנה מהירה של הנתונים והשגת תוצאות‬ ‫מדויקות להפליא‬ ‫תשתית אנליטית אמינה וסקלבילית‬ ‫יכולת‬ ‫ארכיטקטורה סקלבילית מאד לעיבוד וניתוח‬ ‫נתונים‬ ‫ויזואליזציה, פיתוח מודלים אנליטיים ואפליקציות‬ ‫אנליטיות בזכרון ‪In Memory‬‬ ‫שימוש בסביבות מבוזרות כגון ‪ Hadoop‬ו‬ ‫‪ Appliances‬של בסיסי נתונים‬ ‫. ‪C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d‬‬
    • C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
    • SAS VISUAL ANALYTICS EXPLORER • More on this later today C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
    • SAS VISUAL ANALYTICS DESIGNER ‫ יעזרו‬SAS ‫ של‬High Performance -‫פתרונות ה‬ ‫לכם להתמודד עם האתגר‬ • More on this later today C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
    • SAS VISUAL ANALYTICS LASR IN ?‫איך זה עובד‬ MEMORY SERVER Controller SAS® Visual Analytics Client Teradata, Pivotal Or Hadoop C op yr i g h t © 2 0 1 3 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
    • SAS® HIGH-PERFORMANCE ANALYTICS All of your data Model extensively, iteratively, frequently … Management Administration Security Teradata Greenplum Hadoop C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . Better decisions all the time
    • SAS® HIGHPERFORMANCE ?‫איך זה עובד‬ ANALYTICS Controller SAS® ANALYTICS Client Teradata, Pivotal Or Hadoop C op yr i g h t © 2 0 1 3 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
    • SAS® HIGHPERFORMANCE ‫ממשק קוד‬ ANALYTICS high performance -‫על מנת לעבוד בסביבה מבוזרת יש להשתמש בפרוצדורות ה‬ ‫החדשות. במקרה זה מדובר על רגרסיה לוגיסטית‬ option set=GRIDHOST=“green1.sas.com"; option set=GRIDINSTALLLOC="/opt/TKGrid"; libname GPLib greenplm server=gpdca user=XXX password=YYY database=ZZZ; proc hplogistic data=GPLib.MyTable; class A B C D ; model y = a b c b*d x1-x100; output out=GPlib.logout pred=p; run; C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
    • SAS® HIGHPERFORMANCE ENTERPRISE MINER ‫ממשק‬ ANALYTICS • • • • • • • • • • • • • Imputation Transformation Variable Selection Regression Neural Networks Random Forest Decision Trees Generalized Linear Models Principal Components Support Vector Machines Clustering Model Assessment Deployment to Production New in 9.4M1 C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . HPDM tab
    • ‫‪SAS® HIGH‬‬‫‪PERFORMANCE BENCHMARK‬‬ ‫‪ANALYTICS‬‬ ‫מודל הנטישה הבא נבנה מנתוני‬ ‫חברת תקשורת. הקובץ כולל 4.62‬ ‫מיליון תצפיות ו 534 משתנים. הקובץ‬ ‫כולל מאפיינים דמוגרפיים, ‪,billing‬‬ ‫תמיכה טכנית, תוכנית חיוב, מאפייני‬ ‫שיחות, ציוד וכד'.‬ ‫המודל כולל טרנספורמציה, השלמת‬ ‫ערכים חסרים, בחירת משתנים‬ ‫רלבנטיים ורגרסיה לינארית, רשת‬ ‫ניורונים עם 05 איטרציות ורשת‬ ‫ניורונים עם 005 איטרציות.‬ ‫. ‪C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d‬‬
    • ‫משפיעים על מחזור החיים האנליטי‬ ‫•‬ ‫•‬ ‫•‬ ‫•‬ ‫•‬ ‫•‬ ‫‪SAS® HIGH‬‬‫‪PERFORMANCE‬‬ ‫‪ANALYTICS‬‬ ‫ניתוח %001 מהנתונים‬ ‫יותר משתנים‬ ‫מודלים מורכבים יותר‬ ‫יותר איטרציות באלגוריתמים איטרטיביים‬ ‫יותר מודלים‬ ‫יותר שאלות/תסריטים/בעיות לבדיקה ופתרון‬ ‫. ‪C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d‬‬
    • SAS® HIGHPERFORMANCE SAS® IN-DATABASE ANALYTICS C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
    • SAS® HIGHSAS® IN-DATABASE PERFORMANCE KEY COMPONENTS ANALYTICS ANALYTIC INFRASTRUCTURE ANALYTIC INFRASTRUCTURE SAS® SAS® Analytic Quality SAS® Code SAS® DataTasks Scoring Analytics Executed by SAS® Scoring Accelerator Accelerator Accelerator New in SAS 9.4 New Process Accelerator Accelerator DB in SAS 9.4 C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
    • WHAT? SAS® IN-DATABASE Capability ‫יכולת‬ Why it ‫למה זה‬ ‫ חשוב‬Matters ‫ בסיס הנתונים‬Workload Management ‫ בתוך‬SAS ‫עיבוד פונקציות‬ ‫ ניהול נתונים טוב יותר‬jobs and users Effectively manage ‫פישוט תהליך בניית והפצת מודלים‬ High Availability ‫ נתונים קיימים‬Distributed Processing ‫מינוף ארכיטקטורות בסיסי‬ ‫ כפי שהוא ללא תרגום לשפה‬SAS ‫הרצת קוד‬ Use Commodity Hardware ‫אחרת‬ C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . ‫באופן מהיר יותר‬service disruption Avoid user or ‫קבלת תוצאות‬ ‫שיפור בניצול תשתיות מערכות מידע קיימות‬ Improved Performance ‫ יעילות‬Costs Reduce
    • SAS® SCORING ACCELERATOR ‫ארכיטקטורה‬ -‫חדש ! ב‬ ‫4.9 גם‬ Hadoop C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
    • CUSTOMER CASE IN-DATABASE ENABLED STUDY ANALYTICS PROCESS MODEL DEPLOYMENT MODEL DEVELOPMENT DATA EXPLORATION 300 step process ELT to Flat File Use only 350K customers 30 minutes to score 350K Total Time: 3 hours Propensity to Pay $1 to $2 Million / Month C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . Large Telco 10 step process No ETL to Flat File Use all 40M customers 4 minutes to score 40M Total Time: 12 minutes
    • ‫‪SAS® CODE‬‬ ‫‪ACCELERATOR‬‬ ‫• חדש! ב 4.9‬ ‫• הרצת קוד ‪ Data Step‬ישירות בתוך בסיס הנתונים‬ ‫• שימוש בשפה החדשה 2‪ DS‬המאפשרת הרצת קוד מקבילי ומינוף‬ ‫היכולות המקביליות של בסיסי הנתונים‬ ‫2‪DS‬‬ ‫• מאפשר לבצע ניהול והכנת נתונים בתוך בסיס הנתונים ללא צורך‬ ‫בהעברת הנתונים לשרת ה ‪SAS‬‬ ‫• מידע נוסף לגבי שפת 2‪ DS‬בהרצאה של פליקס מילקין בהמשך‬ ‫הכנס‬ ‫. ‪C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d‬‬
    • SAS® DATA QUALITY ACCELERATOR 9.4 ‫• חדש! ב‬ ‫• הרצת פונקציות של טיוב נתונים דמוגרפי (אנשי קשר) ישירות‬ ‫בתוך בסיס הנתונים‬ DQ :‫• דוגמאות של פונקציות‬ Standardization • Matching • Parsing • C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
    • SAS® HIGHPERFORMANCE SAS® GRID COMPUTING ANALYTICS C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d .
    • ‫‪WHAT? SAS® GRID COMPUTING‬‬ ‫למה זה חשוב‬ ‫ניהול תהליכים ומשתמשים בצורה יעילה‬ ‫מניעת הפרעה בעבודת המשתמשים ושירותים‬ ‫ביצועים משופרים‬ ‫הפחתה בעלויות‬ ‫יכולת‬ ‫ניהול עומסים‬ ‫זמינות גבוהה ‪High Availability‬‬ ‫עיבוד מבוזר (ברמת תהליך ולא ברמת‬ ‫אלגוריתם)‬ ‫שימוש בחומרת ‪Commodity‬‬ ‫. ‪C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d‬‬
    • SAS REFERENCE ARCHITECTURE SAS 9.4 CLUSTERED METADATA / WEB APP SERVERS, SAS GRID, IN-DATABASE, IN-MEMORY ANALYTICS SAS® In-Memory Analytics SAS Analyst’s Desktops Analytic Data Warehouse / Marts Clustered SAS Metadata Servers HTTP Server Relational Data Store SAS Grid Manager Server Clustered Web Application Servers Enterprise Data Warehouse with ® SAS In-Database, In-Memory Analytics Server Tier Web Tier Client Tier SAS Grid Compute Nodes Data Tier SAS Web Reporting Clients C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . Metadata Tier
    • SAS & HADOOP SAS® WITHIN THE HADOOP ECOSYSTEM User Interface ® SAS ‫משתמש‬ SAS® Display Manager Data Processing SAS® Data Integration Base SAS & SAS/ACCESS® to Hadoop™ Pig Hive SAS Embedded Process Accelerators SAS® High- Map Reduce File System C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . SAS® Enterprise Miner™ SAS® Visual Analytics ® SAS Metadata Metadata Data Access SAS® Enterprise Guide® Performance Analytic Procedures HDFS SAS ‫משתמש‬ ‫הדור הבא‬ In-Memory Data Access SAS® LASR™ Analytic Server MPI Based
    • ‫‪NEXT GENERATION‬‬ ‫מינוף ‪ BIG DATA‬ואנליטיקה‬ ‫‪ARCHITECTURE‬‬ ‫•‬ ‫•‬ ‫•‬ ‫•‬ ‫•‬ ‫•‬ ‫ניתוח ויזואלי של ‪Big Data‬‬ ‫הורדה דרמטית בזמן עיבוד הנתונים‬ ‫ביצועים מהירים – אלגוריתמים מקביליים‬ ‫אבולוציה של הפרוצדורות האנליטיות של ‪SAS‬‬ ‫מינוף תשתיות מבוזרות על מנת לבזר מידע ועיבודים‬ ‫הזדמנות להסתכל על העסק בצורה אחרת‬ ‫. ‪C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d‬‬
    • ‫תודה‬ C op yr i g h t © 2 0 1 2 , S A S I n s t i t u t e I n c . A l l r i g h t s r es er v e d . www.SAS.com