מהי הטכנולוגיה והפתרון למסיכת נתונים ב-Network Packet Broker?

1. המושג Data Masking

מיסוך נתונים ידוע גם בשם מיסוך נתונים. זוהי שיטה טכנית להמיר, לשנות או לכסות נתונים רגישים כגון מספר טלפון נייד, מספר כרטיס בנק ומידע אחר כאשר נתנו כללים ומדיניות מיסוך. טכניקה זו משמשת בעיקר כדי למנוע שימוש ישיר בנתונים רגישים בסביבות לא אמינות.

עקרון מיסוך נתונים: מיסוך נתונים צריך לשמור על מאפייני הנתונים המקוריים, הכללים העסקיים ורלוונטיות הנתונים כדי להבטיח שהפיתוח, הבדיקה וניתוח הנתונים הבאים לא יושפעו ממיסוך. ודא עקביות ותקפות הנתונים לפני ואחרי מיסוך.

2. סיווג מיסוך נתונים

ניתן לחלק את מיסוך הנתונים למיסוך נתונים סטטי (SDM) ולמסך נתונים דינמי (DDM).

מיסוך נתונים סטטי (SDM): מיסוך נתונים סטטי מחייב הקמת מסד נתונים חדש של סביבת ייצור לבידוד מסביבת הייצור. נתונים רגישים מופקים ממסד הנתונים של הייצור ולאחר מכן מאוחסנים במסד הנתונים הלא-ייצור. באופן זה, הנתונים שעברו רגישות מבודדים מסביבת הייצור, אשר עונה על הצרכים העסקיים ומבטיחה את אבטחת נתוני הייצור.

SDM

מיסוך נתונים דינמי (DDM): הוא משמש בדרך כלל בסביבת הייצור כדי לבטל רגישות לנתונים רגישים בזמן אמת. לפעמים, נדרשות רמות שונות של מיסוך כדי לקרוא את אותם נתונים רגישים במצבים שונים. לדוגמה, תפקידים והרשאות שונים עשויים ליישם סכימות מיסוך שונות.

DDM

יישום דיווח נתונים ומיסוך מוצרי נתונים

תרחישים כאלה כוללים בעיקר מוצרי ניטור נתונים פנימיים או שלטי חוצות, מוצרי נתוני שירות חיצוניים ודוחות המבוססים על ניתוח נתונים, כגון דוחות עסקיים וסקירת פרויקטים.

מיסוך המוצר לדיווח נתונים

3. פתרון מיסוך נתונים

סכימות מיסוך נתונים נפוצות כוללות: ביטול, ערך אקראי, החלפת נתונים, הצפנה סימטרית, ערך ממוצע, היסט ועיגול וכו'.

ביטול תוקף: אי תוקף מתייחס להצפנה, חיתוך או הסתרה של נתונים רגישים. סכימה זו בדרך כלל מחליפה נתונים אמיתיים בסמלים מיוחדים (כגון *). הפעולה פשוטה, אך המשתמשים אינם יכולים לדעת את הפורמט של הנתונים המקוריים, מה שעשוי להשפיע על יישומי הנתונים הבאים.

ערך אקראי: הערך האקראי מתייחס להחלפה אקראית של נתונים רגישים (מספרים מחליפים ספרות, אותיות מחליפות אותיות ותווים מחליפים תווים). שיטת מיסוך זו תבטיח את הפורמט של נתונים רגישים במידה מסוימת ותקל על יישום הנתונים הבא. ייתכן שיהיה צורך במילוני מיסוך עבור כמה מילים משמעותיות, כגון שמות של אנשים ומקומות.

החלפת נתונים: החלפת נתונים דומה למיסוך של ערכים null ואקראיים, אלא שבמקום שימוש בתווים מיוחדים או ערכים אקראיים, נתוני המיסוך מוחלפים בערך ספציפי.

הצפנה סימטרית: הצפנה סימטרית היא שיטת מיסוך הפיכה מיוחדת. הוא מצפין נתונים רגישים באמצעות מפתחות הצפנה ואלגוריתמים. פורמט טקסט ההצפנה תואם את הנתונים המקוריים בכללים לוגיים.

מְמוּצָע: הסכימה הממוצעת משמשת לעתים קרובות בתרחישים סטטיסטיים. עבור נתונים מספריים, אנו מחשבים תחילה את הממוצע שלהם, ולאחר מכן מחלקים באופן אקראי את הערכים חסרי הרגישות סביב הממוצע, ובכך שומרים על סכום הנתונים קבוע.

אופסט ועיגול: שיטה זו משנה את הנתונים הדיגיטליים על ידי שינוי אקראי. עיגול ההיסט מבטיח את האותנטיות המשוערת של הטווח תוך שמירה על אבטחת הנתונים, שקרובים יותר לנתונים האמיתיים מאשר הסכמות הקודמות, ויש לו משמעות רבה בתרחיש של ניתוח ביג דאטה.

ML-NPB-5660-数据脱敏

הדגם המומלץ"ML-NPB-5660" עבור מיסוך הנתונים

4. טכניקות מיסוך נתונים נפוצות

(1). טכניקות סטטיסטיות

דגימת נתונים וצבירת נתונים

- דגימת נתונים: ניתוח והערכה של מערך הנתונים המקורי על ידי בחירת תת-קבוצה מייצגת של מערך הנתונים היא שיטה חשובה לשיפור האפקטיביות של טכניקות ביטול זיהוי.

- צבירת נתונים: כאוסף של טכניקות סטטיסטיות (כגון סיכום, ספירה, ממוצע, מקסימום ומינימום) המיושמות על תכונות במיקרו נתונים, התוצאה מייצגת את כל הרשומות במערך הנתונים המקורי.

(2). קריפטוגרפיה

קריפטוגרפיה היא שיטה נפוצה לחוסר רגישות או לשפר את האפקטיביות של חוסר רגישות. סוגים שונים של אלגוריתמי הצפנה יכולים להשיג אפקטים שונים של חוסר רגישות.

- הצפנה דטרמיניסטית: הצפנה סימטרית לא אקראית. זה בדרך כלל מעבד נתוני מזהה ויכול לפענח ולשחזר את טקסט ההצפנה למזהה המקורי בעת הצורך, אך המפתח צריך להיות מוגן כראוי.

- הצפנה בלתי הפיכה: פונקציית ה-hash משמשת לעיבוד נתונים, המשמשים בדרך כלל לנתוני זיהוי. לא ניתן לפענח ישירות ויש לשמור את קשר המיפוי. בנוסף, בשל התכונה של פונקציית ה-hash, עלולה להתרחש התנגשות נתונים.

- הצפנה הומומורפית: נעשה שימוש באלגוריתם ההומומורפי של טקסט צופן. המאפיין שלו הוא שהתוצאה של פעולת טקסט צופן זהה לזו של פעולת טקסט רגיל לאחר פענוח. לכן, הוא נפוץ לעיבוד שדות מספריים, אך אינו בשימוש נרחב מסיבות ביצועים.

(3). טכנולוגיית מערכת

טכנולוגיית הדיכוי מוחקת או מגינה על פריטי נתונים שאינם עומדים בהגנה על הפרטיות, אך אינה מפרסמת אותם.

- מיסוך: זה מתייחס לשיטת דה-הרגישות הנפוצה ביותר למסך את ערך התכונה, כגון מספר היריב, תעודת זהות מסומנת בכוכבית או הכתובת קטועה.

- דיכוי מקומי: מתייחס לתהליך של מחיקת ערכי תכונה ספציפיים (עמודות), הסרת שדות נתונים לא חיוניים;

- דיכוי רשומות: מתייחס לתהליך של מחיקת רשומות ספציפיות (שורות), מחיקת רשומות נתונים לא חיוניות.

(4). שם בדוי טכנולוגיה

Pseudomanning היא טכניקת ביטול זיהוי המשתמשת בשם בדוי כדי להחליף מזהה ישיר (או מזהה רגיש אחר). טכניקות של שם בדוי יוצרות מזהים ייחודיים עבור כל נושא מידע בודד, במקום מזהים ישירים או רגישים.

- זה יכול ליצור ערכים אקראיים באופן עצמאי כדי להתאים למזהה המקורי, לשמור את טבלת המיפוי ולשלוט בקפדנות על הגישה לטבלת המיפוי.

- אתה יכול גם להשתמש בהצפנה כדי לייצר שמות בדויים, אבל צריך לשמור את מפתח הפענוח כראוי;

טכנולוגיה זו נמצאת בשימוש נרחב במקרה של מספר רב של משתמשי נתונים עצמאיים, כגון OpenID בתרחיש של פלטפורמה פתוחה, שבו מפתחים שונים משיגים Openids שונים עבור אותו משתמש.

(5). טכניקות הכללה

טכניקת הכללה מתייחסת לטכניקת ביטול זיהוי המפחיתה את הפירוט של תכונות נבחרות במערך נתונים ומספקת תיאור כללי ומופשט יותר של הנתונים. טכנולוגיית הכללה קלה ליישום ויכולה להגן על האותנטיות של נתונים ברמת שיא. הוא משמש בדרך כלל במוצרי נתונים או דוחות נתונים.

- עיגול: כולל בחירת בסיס עיגול עבור התכונה שנבחרה, כגון זיהוי פלילי כלפי מעלה או מטה, המניב תוצאות של 100, 500, 1K ו-10K

- טכניקות קידוד עליון ותחתון: החלף ערכים מעל (או מתחת) לסף בסף המייצג את הרמה העליונה (או התחתונה), ומניב תוצאה של "מעל X" או "מתחת ל-X"

(6). טכניקות אקראיות

כסוג של טכניקת דה-זיהוי, טכנולוגיית רנדומיזציה מתייחסת לשינוי הערך של תכונה באמצעות אקראית, כך שהערך לאחר האקראיות שונה מהערך האמיתי המקורי. תהליך זה מקטין את יכולתו של תוקף להפיק ערך תכונה מערכי תכונה אחרים באותה רשומת נתונים, אך משפיע על האותנטיות של הנתונים המתקבלים, המשותף לנתוני בדיקות ייצור.


זמן פרסום: 27 בספטמבר 2022