פיתוח מחסני נתונים: כל מה שצריך לדעת על בסיסי נתונים ומערכות תומכות החלטה

מחסני נתונים

מחסני נתונים (Data Warehouse – DWH) הם הפלטפורמות או מערכות המידע המכילות את כלל מאגרי הנתונים הגולמיים של הארגון. החל מנתונים אודות תמיכה בלקוחות, הזמנת חומרי גלם, רכש, ועד מחזורי המכירות, ניהול שרשראות האספקה והשיווק – כל המידע הארגוני מגולם בתוך מחסני הנתונים.
המידע שמוזרם ממחסני הנתונים דרך המערכות התפעוליות של הארגון (מערכות הלוגיסטיקה, רכש, שירות לקוחות וכן הלאה), יהפוך בסופו של דבר מנתונים גולמיים לתובנות עסקיות.

במערכות ה BI משמשים מסדי הנתונים את מנהלי הארגון בקבלת החלטות והפקת תובנות מניבות לקידום העסק. לכן גם נהוג לקרוא למערכות מחסני הנתונים – מערכות תומכות החלטה.

בכל ארגון, המערכת לניתוח נתונים מפותחת על גבי פלטפורמת בינה עסקית, ומתממשקת עם כל מערכות המידע ומאגרי המידע התפעוליים של החברה (,SAP חשבשבת, פריוריטי  ERP, CRM, MES, WMS או כל מערכת תפעולית אחרת). היא מציגה באופן ויזואלי את כל ניתוחי המידע, הגרפים והתהליכים על סמך מחסני הנתונים שפותחו.

אופן פעולה וסוגי מערכות לאחסון נתונים

מערכות לאחסון נתונים פועלות על פי מתכונת קבועה הכוללת שלושה רבדים עוקבים:

  • אחסון: השלב בו נשמרים הנתונים על גבי המערכת. הם מוזרמים אל הפלטפורמה המרכזית, שם הם מאוחסנים וזמינים מעתה לכל משתמשי הארגון. בשלב זה, הנתונים מוגדרים כנתונים גולמיים, כלומר אין ביכולתו של המשתמש להפיק מהם תובנות או תועלת לצורך קבלת החלטות והתייעלות ארגונית.
  • היתוך: כשמו כן הוא. רובד זה אחראי על מיזוג של נתונים ממקורות המידע הרלוונטיים בארגון, ועל המימוש שלהם. הכוונה היא, שנתונים ממערכות מידע שונות מוצלבים, והופכים מנתונים גולמיים לפרמטרים בעלי ערך מהם יכולים משתמשי הארגון להפיק תובנות. כמובן ששלב המיזוג מחייב אנשי מקצוע ותוכנה מתחומי ה-BI שתפקידם הוא לאפיין את מקורות הנתונים לפתח את פלטפורמת ה-BI על פי צרכי הארגון.
  • גישה / הצגת הנתונים: השלב בו מוצגים הנתונים (בדרך כלל באופן ויזואלי) למשתמשי הארגון. פלטפורמת ה-BI מספקת תובנות ויזואליות בצורת גרפים, דיאגרמות, דשבורדים ועוד. אלו משמשים בתור מקורות נתונים אמינים שיעזור למנהלי הארגון בקבלת ההחלטות.

ברוב הארגונים, עבור מערכת ה-BI מוקמת תשתית שלמעשה מרכזת את כל מחסני הנתונים מכל המערכות התפעוליות הקיימות על גבי פלטפורמה אחת. אנחנו Datacore,למשל, מפתחים את המערכת לניתוח הנתונים על גבי פלטפורמת Power BI מבית מיקרוסופט שזוהי הפלטפורמה המרכזית שתשמש את משתמשי הארגון לצורך שליטה וניהול של המידע בארגון.

מקרים בהם נדרשת ארכיטקטורה מורכבת יותר, מערכת Power BI תחובר למערכות ושירותים נוספים כמו (SSAS (Tabular mode, Azure Data Factory (ADF), Azure Synapse, Azure DWH ו- Azure SQL.
זהו גם הסוג הראשון של המערכות לאחסון נתונים – מערכת רב ענפית שמתמקדת בכל הענפים העסקיים של הארגון ומבצעת כריית נתונים ממערכות הלוגיסטיקה, מכירות, שירות לקוחות, תקציב, שיווק, אספקה, מחסנים, מלאי ועוד.

סוג אחר של מערכת היא מערכת חד ענפית לאחסון נתונים. חברות מסוימות מעדיפות "לבזר" סמכויות בידי כמה ענפים שונים. למשל, ישנן חברות הרואות צורך בהקמת תשתית נתונים רק עבור מחלקת החשבונות, או רק עבור מערך המכירות והרכש.

לשם מה נדרש פיתוח של מחסני נתונים?

כדי לענות על השאלה הזו, ראשית כדאי לחזור אחורה לתחילת של עידן הבינה העסקית.

בעבר, ארגונים נהגו להתבסס על מערכות ידניות לאיסוף וניתוח נתונים, או לחילופין על מערכות BI חד ענפיות (שהוזכרו מקודם). בעידן הנוכחי, המידע הפך להיות גורם קריטי בהתפתחות העסקית והארגונית, במיוחד עבור ארגונים וחברות גדולות מרובות ממשקים. פיתוח מחסני נתונים על גבי פלטפורמה מרכזית פותר את הקושי במיזוג והצלבת נתונים ממספר מערכות מידע הטרוגניות.

כיצד המערכת לניהול המכירות מתמזגת עם המערכת של הנהלת החשבונות? האם נתונים נאבדים בדרך? ובאיזה אופן זה משפיע על שירות הלקוחות שלא מספיק לעמוד בקצב של אנשי המכירות? מחסני הנתונים באים לפתור בדיוק בעיות מהותיות כמו אלו: תמונת מצב עדכנית ומאומתת על כלל התהליכים הארגוניים בכל רגע ורגע.
מחסני נתונים מרכזיים מאפשרים אינטגרציה של המידע מכל המערכות התפעוליות, וניתוח נתונים יעיל שיעזור לקדם את הארגון, לשלוט ביעילות בתהליכים פנימיים ולקבל יותר מהעסק.

לכן, קם הצורך בהקמת תשתית שעליה יפתחו מערכת אמינה שתספק נתונים מהימנים בזמן אמת מכלל מאגרי המידע התפעוליים של הארגון.

מלבד זאת, מחסני הנתונים מספקים פתרון לבעיה מהותית אף יותר מהקודמת. גם במקרים שבהם מערכות ידניות לאיסוף נתונים (או חברות שמשתמשות במערכת BI חד ענפית) מצליחות להתגבר על הקושי במיזוג והצלבת הנתונים (כלומר אינן מאבדות נתונים גולמיים), לרוב הן לא יצליחו לספק למשתמש את הנתונים האופטימליים לצורך הפקת התובנות.

הכוונה היא, שמנהלי הארגון אינם מעוניינים במידע גולמי ממוקד, אלא במערכת חכמה שתדע לנתח את הנתונים בזמן אמת ובאמינות גבוהה. פלטפורמת BI אחידה המסתמכת על מסד נתונים יחיד לאיסוף כל המידע זורם בארגון היא גם הפתרון היעיל ביותר.

ארכיטקטורת מחסני נתונים

הארכיטקטורה מתייחסת לאופן שבו בוחר הארגון ליישם את המערכת לאיסוף וניתוח הנתונים.

קיימות אסטרטגיות יישום שונות, כל אחת מתאימה לאופי ארגוני מסוים ולצרכים של הארגון. כמו כן, ארכיטקטורות שונות באות לפתור בעיות ארגוניות או עסקיות שזוהו כבעייתיות על ידי המנהלים ומפתחי ה-BI בשלבי האפיון הראשוניים.
במקרים מסוימים, יתוספו על גבי מחסן הנתונים הראשי שלוחות של שרתי משנה אליהן יועתקו חלק מהנתונים, זאת עקב אילוצים שונים של הארגון, או על מנת לממש פונקציות שונות בתוך הארגון.
מאין נולדה הארכיטקטורה? בעיקר מאילוצים ארגוניים, ומהעבודה שלא הייתה תכנית עבודה מסודרת להקמת פלטפורמה מרכזית אחת מההתחלה.

Top – Down Approach: גישה קלאסית עבור חברות BI שמבקשות לבצע "מהפכה" בתרבות המידע של הארגון. הארכיטקטורה, כשמה כן היא: בניית מסד נתונים יחד ומרכזי מאפס, שיאגד בתוכו את כל הנתונים מכל מערכות המידע שקיימות לארגון.

Bottom – Up Approach: גישה הפוכה לקודמת. לכל תת מערכת תפעולית בארגון (הנהלת חשבונות, תפעול ולוגיסטיקה, רכש וכן האלה) מפותחת מערכת מחסני נתונים, כאשר בסופו של התהליך כל תתי המערכות מתמזגות לכדי פלטפורמה אחת מרכזית.

השיטה המעורבת: ארכיטקטורה שנבנית במקרים בהם רק לחלק מהמחלות התפעוליות בארגון קיימת מערכת BI. מה שקורה בפועל הוא שמחלקות ה-BI ממשיכות לעשות שימוש במחסני הנתונים שלהן, בעוד מחלקות ללא מחסני נתונים, נשענות גם הן על אותם מחסני נתונים.

המאפיינים של מערכות לאחסון נתונים

מחסן הנתונים הוא כלי לאחזור מידע. בכך, הוא מסתמך לחלוטין על המערכות התפעוליות של הארגון, ואינו יודע לייצר מידע חדש בעצמו. התלות של הפלטפורמה המרכזית לאיסוף הנתונים מדגישה עד כמה חשובה עבודתו של מפתח ה-BI בשימור הנתונים והצגה אמינה ומדויקת שלהם בפני מנהלי הארגון.

כמו כן, מערכות לאחסון נתונים הם מערכות עם עומק היסטורי יוצא דופן. מתוך המאגרים ניתן לשלוף מידע ישן, לחפש מקרי קצה ותהליכים קריטיים שקרו בארגון לפני שנים.

כלי התוכנה איתם עובדים מול מחסני הנתונים אינם בהכרח מאופיינים בזמני עבודה קצרים.

להבדיל ממערכות אחרות לעיבוד מידע ארגוני, ניתוח הנתונים שנשלפים ממחסן הנתונים עשוי להארך זמן מה. הדגש הוא, אם כן, על האיכות של הנתונים ולאו דווקא על מהירות העיבוד.

לסיום, חשוב להבדיל בין פיתוח מחסני נתונים לבין פיתוח מערכת לעיבוד נתונים / מערכות עיבוד תנועות. האחרונה מתייחסת לארגונים שבוחרים להקים מערכת המתעדת את כל הפעולות בארגון במטרה ליצור מעקב ובקרה. בשונה ממערכות לאחסון נתונים, מערכות אלו אינן נחשבות מערכות ממוחשבות לתמיכה בתהליך קבלת ההחלטות.

פרמטרים מרכזיים לתכנון ופיתוח איכותיים של מחסני נתונים

כל ניהול פרויקט של פיתוח מחסני נתונים נחשב לפרויקט בסדר גודל עצום, שיכול להסתכם בהוצאה כספית לא מבוטלת. מאחר ומחסני הנתונים משמשים את חברות ה-BI שנים קדימה, והופכים להיות הפלטפורמה המרכזית עליה נשענים כל תהליכי קבלת ההחלטות, חשוב מאוד להיצמד לתכנית עבודה מסודרת ולשים דגש על מספר פרמטרים מרכזיים.

בקצרה, התכנון של הקמת מחסני הנתונים הוא חלק מתהליך האפיון של מערכות ה-BI, ומערב בתוכו צעדים של ניתוח נתונים ממערכות המידע הקיימות, גזירת הנתונים, הסבתם וטיובם למערכת מרכזית בהתאם לפתרון העסקי שהארגון מחפש.

שלבי התכנון שקודמים לפיתוח מחסני הנתונים נשענים גם על הפרמטרים הבאים:

  • כמות המידע / נתונים בהשוואה לשכיחות השינויים – כמות המידע משפיעה כמובן באופן ישיר על גדול מחסני הנתונים, המשאבים שצריך לגייס על מנת לתפעל את המחסנים, יעילות העבודה, מהירות שליפת הנתונים ועוד.
  • כשמתכננים את מחסני הנתונים, תפקידם של האנליסטים ומפתחי הבינה העסקית הוא לקבוע את היחס בין כמות המידע והשכיחות של השינויים שלה.
    לדוגמא, אם נדרש מהפלטפורמה לכרות נתונים ממחלקת החשבונות אודות עסקאות המט"ח או נתונים אודות משקיעים פוטנציאלים בחברה, אין טעם לשמור מידע פרטי על הלקוח (מקומות מגורים לדוגמא) כי סביר להניח שהוא לא החליף את מקום מגוריו לעיתים תכופות. חשוב יותר יהיה להתרכז בהיסטוריה של העסקאות עצמן – סכומי ההשקעות, ירידות השערים וכן הלאה.
  • דיוק הנתונים – נראה לכאורה שמדובר בשאלה לא רלוונטית. הרי כל המנהלים מעוניינים בנתונים כמה שיותר מדויקים על מנת לבצע החלטות מושכלות, ולא על סמך תחושות בטן.
    עם זאת, כולנו מבינים גם שעלייה בדיוק ואמינות הנתונים כרוכה גם בפיתוח מורכב יותר ושימוש בארכיטקטורות עם פונקציות מרובות.
    לכן, כדאי לתכנן את הקמת המחסנים בהתאם לפרמטר הזה. לדוגמא, דשבורדים המציגים דו"ח עסקאות שנתי או אחוזי מכירות יכולים להתעלם מחישוב של אגורות או שקלים בודדים, כי אלו באמת לא ישנו את התובנות העסקיות.

לצד אלו, חשוב להתייחס גם לפרמטרים הבאים: קהל היעד של המערכת לאחסון נתונים (גודל, משתמשי קצה, האם המערכת עונה על צרכי הלקוח?), לוח הזמנים של הפרויקט (עד כמה דחופה הקמת מחסני הנתונים?), האם כל משתמשי הארגון זקוקים למחסני הנתונים, וכן הלאה.

פיתוח ותכנון של מערכת לאחסון נתונים היא אמנם פרויקט בסדר גדול נרחב, אך היא גם השקעה חד פעמית שתניב פירות עסקיים מהרגע שתצא לאוויר.

אם אתם נתקלים בקשיים בניתוח הנתונים ומרגישים צורך בשליטה וניהול טובים יותר, אתם מוזמנים להתייעץ עם המומחים שלנו ולהתקדם לפלטפורמת Power BI חכמה.
הפלטפורמה תעזור לכם לייצר דוחות אינטראקטיביים מקיפים, תציג את הנתונים באופן חזותי וקל לניתוח, ותסייע לכם לייצר דוחות ולשלוח דשבורדים בקלות עם התממשקות נוחה לכל סביבת ה- office ומכל מקום.

מומחי ה-BI, האנליסטים ומפתחי התוכנה של חברת DataCore עומדים לרשותכם משלבי התכנון הראשוניים ועד ההקמה בפועל של מחסני הנתונים. אנו קשובים לצרכי הלקוח, ומתאימים את ארכיטקטורת המחסנים בהתאם לפתרונות העסקיים והארגוניים להם הארגון שלכם זקוק.

צוות האנליסטים והמומחים של DataCore יספק לכם מערכת חכמה הנשענת על פלטפורמה מרכזית אחת שמותאמת במיוחד לאופי העסקי ולמטרות שלכם.

תוכן