מהי טכנולוגיית מיסוך הנתונים והפתרון ב-Network Packet Broker?

1. מושג מיסוך הנתונים

מיסוך נתונים ידוע גם בשם מיסוך נתונים. זוהי שיטה טכנית להמרה, שינוי או כיסוי של נתונים רגישים כגון מספר טלפון נייד, מספר כרטיס אשראי ומידע אחר, כאשר קיימים כללי ומדיניות מיסוך. טכניקה זו משמשת בעיקר כדי למנוע שימוש ישיר בנתונים רגישים בסביבות לא אמינות.

עקרון מיסוך נתונים: מיסוך נתונים צריך לשמור על מאפייני הנתונים המקוריים, כללי העסק ורלוונטיות הנתונים כדי להבטיח שהפיתוח, הבדיקות וניתוח הנתונים הבאים לא יושפעו מהמיסוך. יש להבטיח עקביות ותוקף נתונים לפני ואחרי המיסוך.

2. סיווג מיסוך נתונים

ניתן לחלק מיסוך נתונים למיסוך נתונים סטטי (SDM) ולמיסוך נתונים דינמי (DDM).

מיסוך נתונים סטטי (SDM)מיסוך נתונים סטטי דורש הקמה של מסד נתונים חדש שאינו בסביבת ייצור לצורך בידוד מסביבת הייצור. נתונים רגישים מופקים ממסד הנתונים של הייצור ולאחר מכן מאוחסנים במסד הנתונים שאינו בסביבת ייצור. בדרך זו, הנתונים שעברו ביטול רגישות מבודדים מסביבת הייצור, מה שעונה על צרכי העסק ומבטיח את אבטחת נתוני הייצור.

SDM

מיסוך נתונים דינמי (DDM)הוא משמש בדרך כלל בסביבת הייצור כדי להפחית רגישות של נתונים רגישים בזמן אמת. לעיתים, נדרשות רמות שונות של מיסוך כדי לקרוא את אותם נתונים רגישים במצבים שונים. לדוגמה, תפקידים והרשאות שונים עשויים ליישם ערכות מיסוך שונות.

DDM

אפליקציית דיווח נתונים ומיסוך מוצרי נתונים

תרחישים כאלה כוללים בעיקר מוצרים פנימיים לניטור נתונים או שלטי חוצות, מוצרי נתוני שירות חיצוניים ודוחות המבוססים על ניתוח נתונים, כגון דוחות עסקיים וסקירת פרויקטים.

מיסוך מוצר דיווח נתונים

3. פתרון מיסוך נתונים

תוכניות מיסוך נתונים נפוצות כוללות: ביטול, ערך אקראי, החלפת נתונים, הצפנה סימטרית, ערך ממוצע, קיזוז ועיגול וכו'.

פסילהביטול תקלות מתייחס להצפנה, קיצוץ או הסתרה של נתונים רגישים. סכימה זו בדרך כלל מחליפה נתונים אמיתיים בסמלים מיוחדים (כגון *). הפעולה פשוטה, אך משתמשים אינם יכולים לדעת את הפורמט של הנתונים המקוריים, דבר שעשוי להשפיע על יישומי נתונים עתידיים.

ערך אקראיערך אקראי מתייחס להחלפה אקראית של נתונים רגישים (מספרים מחליפים ספרות, אותיות מחליפות אותיות ותווים מחליפים תווים). שיטת מיסוך זו תבטיח במידה מסוימת את הפורמט של נתונים רגישים ותקל על יישום נתונים לאחר מכן. ייתכן שיהיה צורך במילוני מיסוך עבור מילים בעלות משמעות מסוימות, כגון שמות של אנשים ומקומות.

החלפת נתוניםהחלפת נתונים דומה להסתרת ערכים ריקים ואקראיים, אלא שבמקום להשתמש בתווים מיוחדים או בערכים אקראיים, נתוני המיסוך מוחלפים בערך ספציפי.

הצפנה סימטריתהצפנה סימטרית היא שיטת מיסוך הפיכה מיוחדת. היא מצפינה נתונים רגישים באמצעות מפתחות הצפנה ואלגוריתמים. פורמט הטקסט המוצפן עולה בקנה אחד עם הנתונים המקוריים בכללים לוגיים.

מְמוּצָעסכמת הממוצע משמשת לעתים קרובות בתרחישים סטטיסטיים. עבור נתונים מספריים, ראשית אנו מחשבים את הממוצע שלהם, ולאחר מכן מפזרים באופן אקראי את הערכים הלא רגישים סביב הממוצע, ובכך שומרים על סכום הנתונים קבוע.

קיזוז ועיגולשיטה זו משנה את הנתונים הדיגיטליים על ידי הזזה אקראית. עיגול ההיסט מבטיח את האותנטיות המשוערת של הטווח תוך שמירה על אבטחת הנתונים, הקרובה יותר לנתונים האמיתיים מאשר הסכמות הקודמות, ויש לה משמעות רבה בתרחיש של ניתוח ביג דאטה.

ML-NPB-5660-数据脱敏

המודל המומלץML-NPB-5660"עבור מיסוך הנתונים

4. טכניקות מיסוך נתונים נפוצות

(1). טכניקות סטטיסטיות

דגימת נתונים וצבירת נתונים

- דגימת נתונים: ניתוח והערכה של מערך הנתונים המקורי על ידי בחירת תת-קבוצה מייצגת של מערך הנתונים היא שיטה חשובה לשיפור יעילותן של טכניקות זיהוי אובייקטיבי.

- צבירת נתונים: כאוסף של טכניקות סטטיסטיות (כגון סיכום, ספירה, ממוצע, מקסימום ומינימום) המיושמות על תכונות במיקרו-נתונים, התוצאה מייצגת את כל הרשומות במערך הנתונים המקורי.

(2). קריפטוגרפיה

קריפטוגרפיה היא שיטה נפוצה להפחתת רגישות או לשיפור יעילותה של דה-סנסיטיזציה. סוגים שונים של אלגוריתמי הצפנה יכולים להשיג אפקטים שונים של דה-סנסיטיזציה.

- הצפנה דטרמיניסטית: הצפנה סימטרית לא אקראית. היא בדרך כלל מעבדת נתוני זיהוי ויכולה לפענח ולשחזר את הטקסט המוצפן לזיהוי המקורי בעת הצורך, אך יש להגן כראוי על המפתח.

- הצפנה בלתי הפיכה: פונקציית ה-hash משמשת לעיבוד נתונים, המשמשים בדרך כלל לנתוני זיהוי. לא ניתן לפענח אותם ישירות ויש לשמור את קשרי המיפוי. בנוסף, בשל תכונת פונקציית ה-hash, עלולה להתרחש התנגשות נתונים.

- הצפנה הומומורפית: נעשה שימוש באלגוריתם הומומורפי של טקסט מוצפן. מאפיין שלו הוא שתוצאת פעולת הטקסט המוצפן זהה לזו של פעולת טקסט רגיל לאחר פענוח. לכן, הוא משמש בדרך כלל לעיבוד שדות מספריים, אך אינו נמצא בשימוש נרחב מסיבות ביצועים.

(3). טכנולוגיית מערכת

טכנולוגיית הדיכוי מוחקת או מגינה על פריטי נתונים שאינם עומדים בדרישות הגנת הפרטיות, אך אינה מפרסמת אותם.

- מיסוך: מתייחס לשיטת הדה-סנסיטיזציה הנפוצה ביותר להסתרת ערך התכונה, כגון מספר היריב, תעודת זהות המסומנת בכוכבית, או קיצור הכתובת.

- דיכוי מקומי: מתייחס לתהליך של מחיקת ערכי מאפיינים ספציפיים (עמודות), הסרת שדות נתונים שאינם חיוניים;

- דיכוי רשומות: מתייחס לתהליך של מחיקת רשומות ספציפיות (שורות), מחיקת רשומות נתונים לא חיוניות.

(4). טכנולוגיית שם בדוי

פסאודומאנינג היא טכניקת דה-זיהוי המשתמשת בשם בדוי כדי להחליף מזהה ישיר (או מזהה רגיש אחר). טכניקות של פסאודונים יוצרות מזהים ייחודיים עבור כל נושא מידע בנפרד, במקום מזהים ישירים או רגישים.

- זה יכול לייצר ערכים אקראיים באופן עצמאי כדי להתאים למזהה המקורי, לשמור את טבלת המיפוי ולשלוט בקפדנות בגישה לטבלת המיפוי.

ניתן גם להשתמש בהצפנה כדי לייצר שמות בדויים, אך יש לשמור את מפתח הפענוח כראוי;

טכנולוגיה זו נמצאת בשימוש נרחב במקרה של מספר רב של משתמשי נתונים עצמאיים, כגון OpenID בתרחיש הפלטפורמה הפתוחה, שבו מפתחים שונים משיגים OpenIDs שונים עבור אותו משתמש.

(5). טכניקות הכללה

טכניקת הכללה מתייחסת לטכניקת דה-זיהוי אשר מפחיתה את הפירוט של מאפיינים נבחרים במערך נתונים ומספקת תיאור כללי ומופשט יותר של הנתונים. טכנולוגיית הכללה קלה ליישום ויכולה להגן על האותנטיות של נתונים ברמת הרשומה. היא משמשת בדרך כלל במוצרי נתונים או בדוחות נתונים.

- עיגול: כרוך בבחירת בסיס עיגול עבור התכונה שנבחרה, כגון ניתוח פורנזי כלפי מעלה או כלפי מטה, מניב תוצאות של 100, 500, 1K ו-10K

- טכניקות קידוד עליון ותחתון: החלפת ערכים מעל (או מתחת) לסף בסף המייצג את הרמה העליונה (או התחתונה), ומניבה תוצאה של "מעל X" או "מתחת ל-X".

(6). טכניקות אקראיות

כמעין טכניקת דה-זיהוי, טכנולוגיית אקראיות מתייחסת לשינוי הערך של מאפיין באמצעות אקראיות, כך שהערך לאחר האקראיות שונה מהערך האמיתי המקורי. תהליך זה מפחית את היכולת של תוקף להפיק ערך מאפיין מערכי מאפיין אחרים באותו רשומת נתונים, אך משפיע על האותנטיות של הנתונים המתקבלים, דבר נפוץ בנתוני בדיקות ייצור.


זמן פרסום: 27 בספטמבר 2022