Data Scientist נ 'מהנדס נתונים, מה ההבדל?

מומחי נתונים ומהנדסי נתונים עשויים להיות כותרות עבודה חדשות, אך תפקידי תפקידים מרכזיים קיימים כבר זמן מה. באופן מסורתי, כל מי שמנתח נתונים נקרא "מנתח נתונים" והופך ל"מפתח למודיעין עסקי (BI) ", היוצר פלטפורמת backend לתמיכה בניתוח נתונים.

עם הופעתם של נתונים גדולים, נתונים חדשים צצו בתאגידים ומרכזי מחקר - מדעני נתונים ומהנדסי נתונים.

להלן סקירה קצרה של תפקיד אנליסט נתונים, מתכנת BI, מומחה נתונים ומהנדס נתונים.

מנתח נתונים

אנליסטים הם אנשי מקצוע מנוסים עם היכולת לשאול ולעבד נתונים בארגונם, לדווח, לסכם ולדמיין נתונים. הם יודעים להשתמש בכלים וטכניקות קיימים כדי לפתור בעיות, ועוזרים לאנשים ברחבי החברה להבין שאילתות ספציפיות באמצעות דוחות ולוחות זמנים אד הוק.

עם זאת, הם לא צפויים לעסוק בניתוח נתונים גדולים, ולרוב לא צפויים שיהיו להם נתונים מתמטיים או מחקריים לפיתוח אלגוריתמים חדשים לבעיות ספציפיות.

מיומנויות וכלים: מנתחי נתונים צריכים להיות בעלי ידע בסיסי במיומנויות בסיסיות: סטטיסטיקות, איסוף נתונים, הדמיית נתונים, חיפוש נתונים, Microsoft Excel, SPSS, SPSS Modeler, SAS, SAS Miner, SQL, Microsoft Access, Tableau, SSAS.

מפתחי בינה עסקית

יצרני בינה עסקית הם אנשי מקצוע המקיימים מערכת יחסים קרובה יותר עם בעלי עניין פנימיים בכדי להבין את צרכי הדיווח ואז לגבות דרישות, ליצור פתרונות דיווח ל- BI וחברות. עליהם לתכנן, לפתח ולתחזק מסדי נתונים חדשים וקיימים, חבילות ETL, קוביות, לוחות מחוונים ודוחות אנליטיים.

בנוסף, הם עובדים עם מסדי נתונים חוצי-ממדיים ועליהם להיות בעלי מיומנויות נרחבות בפיתוח SQL לשילוב נתונים ממגוון מקורות. הם משתמשים בכל הכישורים הללו כדי לענות על צרכי השירות העצמי של הארגון. בדרך כלל, מפיק ה- BI לא צפוי לבצע ניתוח נתונים.

מיומנויות וכלים: ETL, עיבוד דוחות, OLAP, קוביות, מודיעין אתרים, עיצוב אובייקטים עסקיים, טבלאו, כלי לוח מחוונים, SQL, SSAS, SSIS.

מהנדס מידע

מהנדסי נתונים הם מומחי נתונים שמכינים תשתית "נתונים גדולים" שמנותחת על ידי מומחי נתונים. מדובר במהנדסי תוכנה המעצבים, בונים, משלבים ומנהלים נתונים גדולים ממגוון מקורות. לאחר מכן הם כותבים שאילתות מורכבות, מוודאים שקל להגיע אליהם, עובדים בצורה חלקה, ומטרתם היא למטב את הביצועים של מערכת האקולוגיות הגדולה של החברה.

הם יכולים גם להריץ כמה תוכניות ETL (Extract, Transform and Load) על מערכי נתונים גדולים וליצור מסדי נתונים גדולים שיכולים לשמש מדעני נתונים לדיווח או לניתוח. . כמו כן, מכיוון שמהנדסי נתונים מתמקדים יותר בתכנון ובארכיטקטורה, הם בדרך כלל לא מצפים לדעת כל למידה או ניתוח מכונות לנתונים גדולים.

מיומנויות וכלים: Hadoop, MapReduce, Hive, Pig, MySQL, MongoDB, Cassandra, Flow Data, NoSQL, SQL, Programming.

מדען נתונים

מדען הנתונים האלכימאי של המאה העשרים ואחת: מישהו שהופך נתונים גולמיים למושגים מעודנים. מדעני נתונים משתמשים בגישות אנליטיות כדי לפתור בעיות חשובות בסטטיסטיקה, למידת מכונות ועסקים. המשימה העיקרית שלהם היא לעזור לארגונים להפוך כמויות גדולות של נתונים גדולים לתובנות בעלות ערך ויעיל.

למעשה, מדעי הנתונים אינם כיוון חדש לחלוטין, אך ניתן לראות בו רמה מתקדמת של ניתוח נתונים הנשלטת ואוטומטית על ידי למידת מכונות ומדעי המחשב. במילים אחרות, למדעני נתונים יש כישורי תכנות חזקים, אלגוריתמים חדשים, עיבוד נתונים גדולים וידע בתחום, בנוסף לניתוח נתונים, בהשוואה ל"אנליסטים של נתונים ". צפוי.

בנוסף, מדעני נתונים צפויים לפרש ולשתף בחופשיות את ממצאי הממצאים שלהם עם סיפורים מעניינים כיצד לדמיין אותם, ליצור יישומי נתונים או לפתור את בעיות עסקיהם בנתונים.

כישורי פיתרון בעיות של מדעני נתונים דורשים הבנה של טכניקות ניתוח נתונים מסורתיות וחדשות כאחד לבניית מודלים סטטיסטיים או זיהוי דפוסים בנתונים. דוגמאות לכך כוללות יצירת מערכת הפניה, חיזוי שוק המניות, אבחון מבוסס מטופל או מציאת עסקאות מזויפות.

לפעמים ניתן לספק נתונים למדענים בכלל כאשר אין בעיה עסקית. במקרה זה, מדען נתונים סקרן צפוי ללמוד את המידע, למצוא את השאלות הדרושות לך ולספק ממצאים מעניינים! זה קשה, מכיוון שמומחי אנליטיקס נתונים חזקים מאוד נלהבים מניתוח נתונים, איסוף נתונים, סטטיסטיקות ושיטות שונות בתשתית Big Data. חייב להיות בעל ידע רב.

עליהם להיות בעלי ניסיון בעבודה עם קבוצות נתונים שונות בגדלים וצורות שונות ולהשתמש באלגוריתמים שלהם למידע בקנה מידה גדול באופן יעיל ויעיל, מה שאומר בדרך כלל להיות מודע לכל הטכנולוגיות החדישות ביותר. זו הסיבה שחשוב להכיר את היסודות של מדעי המחשב והתכנות, כולל שפות וטכנולוגיות מסד נתונים (גדולים / קטנים).

מיומנויות וכלים: Python, R, Scala, Apache Spark, Hadoop, כלי חיפוש נתונים ואלגוריתמים, למידת מכונות, סטטיסטיקה.

MUORO - נתונים וניתוח גאון muoro.io