מה הטכנולוגיה והפתרון של מיסוך נתונים אצל מתווך מנות רשת?

1. הרעיון של מיסוך נתונים

מיסוך נתונים ידוע גם כמיסוך נתונים. זוהי שיטה טכנית להמרה, לשנות או לכסות נתונים רגישים כגון מספר טלפון נייד, מספר כרטיס בנק ומידע אחר כאשר מסרנו כללי מיסוך ומדיניות. טכניקה זו משמשת בעיקר כדי למנוע שימוש ישירות בנתונים רגישים בסביבות לא אמינות.

עקרון מיסוך נתונים: מיסוך נתונים צריך לשמור על מאפייני הנתונים המקוריים, הכללים העסקיים ורלוונטיות הנתונים כדי להבטיח שהפיתוח, הבדיקה וניתוח הנתונים שלאחר מכן לא יושפעו מהמיסוך. להבטיח עקביות ותוקף נתונים לפני ואחרי מיסוך.

2. סיווג מיסוך נתונים

ניתן לחלק מיסוך נתונים למיסוך נתונים סטטי (SDM) ולמיסוך נתונים דינמי (DDM).

מיסוך נתונים סטטי (SDM): מיסוך נתונים סטטי מחייב הקמת מסד נתונים חדש שאינו ייצור לסביבת בידוד מסביבת הייצור. נתונים רגישים מופקים ממסד הנתונים לייצור ואוחרים במסד הנתונים שאינו ייצור. באופן זה, הנתונים המופעלים ללא רגישות מבודדים מסביבת הייצור, העונה על צרכים עסקיים ומבטיחים אבטחת נתוני הייצור.

SDM

מיסוך נתונים דינמי (DDM): בדרך כלל הוא משמש בסביבת הייצור כדי להפיל נתונים רגישים בזמן אמת. לפעמים נדרשות רמות מיסוך שונות כדי לקרוא את אותם נתונים רגישים במצבים שונים. לדוגמה, תפקידים והרשאות שונות עשויים ליישם תוכניות מיסוך שונות.

DDM

דיווח על נתונים ויישום מיסוך מוצרי נתונים

תרחישים כאלה כוללים בעיקר מוצרי ניטור נתונים פנימיים או שלטי חוצות, מוצרי נתוני שירות חיצוניים ודוחות המבוססים על ניתוח נתונים, כגון דוחות עסקיים וסקירת פרויקטים.

מיסוך דיווח על נתונים

3. פתרון מיסוך נתונים

תוכניות מיסוך נתונים נפוצות כוללות: ביטול, ערך אקראי, החלפת נתונים, הצפנה סימטרית, ערך ממוצע, קיזוז ועיגול וכו '.

ביטול: ביטול מתייחס להצפנה, גיזום או הסתרה של נתונים רגישים. סכמה זו מחליפה בדרך כלל נתונים אמיתיים בסמלים מיוחדים (כגון *). הפעולה היא פשוטה, אך המשתמשים אינם יכולים לדעת את הפורמט של הנתונים המקוריים, אשר עשויים להשפיע על יישומי נתונים עוקבים.

ערך אקראי: הערך האקראי מתייחס להחלפה אקראית של נתונים רגישים (מספרים מחליפים ספרות, אותיות מחליפות אותיות ותווים מחליפים תווים). שיטת מיסוך זו תבטיח את פורמט הנתונים הרגישים במידה מסוימת ותאפשר יישום נתונים עוקב אחר כך. יתכן שיהיה צורך במילוני מיסוך למילים משמעותיות, כמו שמות של אנשים ומקומות.

החלפת נתונים: החלפת נתונים דומה למיסוך ערכים אפסיים ואקראיים, פרט לכך שבמקום להשתמש בתווים מיוחדים או בערכים אקראיים, נתוני המיסוך מוחלפים בערך ספציפי.

הצפנה סימטרית: הצפנה סימטרית היא שיטת מיסוך הפיכה מיוחדת. זה מצפן נתונים רגישים באמצעות מפתחות הצפנה ואלגוריתמים. פורמט CipherText תואם את הנתונים המקוריים בכללים לוגיים.

מְמוּצָע: התוכנית הממוצעת משמשת לרוב בתרחישים סטטיסטיים. עבור נתונים מספריים, אנו מחשבים תחילה את הממוצע שלהם, ואז מפיצים באופן אקראי את הערכים הרגישים על הרגישות סביב הממוצע, ובכך שומרים על סכום הנתונים קבוע.

קיזוז ומעגל: שיטה זו משנה את הנתונים הדיגיטליים על ידי שינוי אקראי. עיגול הקיזוז מבטיח את האותנטיות המשוערת של הטווח תוך שמירה על אבטחת הנתונים, שקרוב יותר לנתונים האמיתיים מאשר לתכניות הקודמות, ויש לו משמעות רבה בתרחיש של ניתוח נתונים גדולים.

ML-NPB-5660- 数据脱敏

המודל הממליץ "ML-NPB-5660"עבור מיסוך הנתונים

4. טכניקות מיסוך נתונים נפוצות

(1). טכניקות סטטיסטיות

דגימת נתונים וצבירת נתונים

- דגימת נתונים: ניתוח והערכה של מערך הנתונים המקורי על ידי בחירת קבוצת משנה מייצגת של מערך הנתונים היא שיטה חשובה לשיפור היעילות של טכניקות זיהוי דה-זיהוי.

- צבירת נתונים: כאוסף של טכניקות סטטיסטיות (כגון סיכום, ספירה, ממוצעים, מקסימום ומינימום) המיושמים על תכונות במיקרו -דת, התוצאה מייצגת את כל הרשומות במערך הנתונים המקורי.

(2). קריפטוגרפיה

קריפטוגרפיה היא שיטה נפוצה לחוסר רגישות או לשפר את היעילות של הרגישות. סוגים שונים של אלגוריתמי הצפנה יכולים להשיג השפעות שונות של רגישות.

- הצפנה דטרמיניסטית: הצפנה סימטרית שאינה אקראית. בדרך כלל הוא מעבד נתוני מזהי ויכול לפענח ולשחזר את הצופן המזהה המקורי במידת הצורך, אך יש להגן על המפתח כראוי.

- הצפנה בלתי הפיכה: פונקציית ה- hash משמשת לעיבוד נתונים, המשמשת בדרך כלל לנתוני זיהוי. לא ניתן לפענח ישירות ויש לשמור את יחסי המיפוי. בנוסף, בשל התכונה של פונקציית ה- hash, יתכן שתתרחש התנגשות נתונים.

- הצפנה הומומורפית: משתמשים באלגוריתם ההומומורפי הצופן. המאפיין שלה הוא שהתוצאה של פעולת CipherText זהה לזו של פעולת פלאינטקסט לאחר הפענוח. לכן הוא משמש לרוב לעיבוד שדות מספריים, אך הוא אינו נמצא בשימוש נרחב מסיבות ביצועים.

(3). טכנולוגיית מערכת

טכנולוגיית הדיכוי מוחקת או מגן על פריטי נתונים שאינם עומדים בהגנת הפרטיות, אך אינה מפרסמת אותם.

- מיסוך: זה מתייחס לשיטת הרגישות הנפוצה ביותר כדי להסוות את ערך התכונה, כגון מספר היריב, תעודת זהות מסומנת בכוכבית, או שהכתובת קטועה.

- דיכוי מקומי: מתייחס לתהליך של מחיקת ערכי תכונה ספציפיים (עמודות), הסרת שדות נתונים לא חיוניים;

- דיכוי רשומות: מתייחס לתהליך מחיקת רשומות ספציפיות (שורות), מחיקת רשומות נתונים שאינן חיוניות.

(4). טכנולוגיית שם בדוי

Psoudomanning היא טכניקת זיהוי המשתמשת בשם בדוי כדי להחליף מזהה ישיר (או מזהה רגיש אחר). טכניקות שם בדוי יוצרות מזהים ייחודיים לכל נושא מידע פרטני, במקום מזהים ישיר או רגיש.

- זה יכול ליצור ערכים אקראיים באופן עצמאי כדי להתכתב עם המזהה המקורי, לשמור את טבלת המיפוי ולשלוט בקפדנות על הגישה לטבלת המיפוי.

- אתה יכול גם להשתמש בהצפנה כדי לייצר שם בדוי, אך צריך לשמור על מפתח הפענוח כראוי;

טכנולוגיה זו נמצאת בשימוש נרחב במקרה של מספר גדול של משתמשי נתונים עצמאיים, כגון OpenID בתרחיש הפלטפורמה הפתוחה, שם מפתחים שונים משיגים OpenID שונים עבור אותו משתמש.

(5). טכניקות הכללה

טכניקת הכללה מתייחסת לטכניקת זיהוי המפחיתה את הגרגיריות של תכונות נבחרות במערך נתונים ומספקת תיאור כללי ומופשט יותר של הנתונים. טכנולוגיית הכללה קלה ליישום ויכולה להגן על האותנטיות של נתונים ברמת הרשומה. הוא משמש בדרך כלל במוצרי נתונים או בדוחות נתונים.

- עיגול: כרוך בבחירת בסיס עיגול עבור התכונה שנבחרה, כגון פלילי כלפי מעלה או כלפי מטה, מניבה תוצאות 100, 500, 1K ו- 10K

- טכניקות קידוד למעלה ותחתון: החלף ערכים למעלה (או מתחת) את הסף בסף המייצג את רמת העליונה (או התחתית), ומניב תוצאה של "מעל x" או "מתחת x"

(6). טכניקות אקראיות

כסוג של טכניקת זיהוי דה-זיהוי, טכנולוגיית האקראיות מתייחסת לשינוי הערך של תכונה באמצעות אקראיות, כך שהערך לאחר האקראיות שונה מהערך האמיתי המקורי. תהליך זה מצמצם את יכולתו של תוקף להפיק ערך תכונה מערכי תכונה אחרים באותו רשומת נתונים, אך משפיע על האותנטיות של הנתונים שהתקבלו, הנפוצים בנתוני מבחן הייצור.


זמן הודעה: ספטמבר 27-2022