1. Veri maskeleme kavramı
Veri maskeleme aynı zamanda veri maskelemesi olarak da bilinir. Maskeleme kuralları ve politikaları verdiğimizde cep telefonu numarası, banka kartı numarası ve diğer bilgiler gibi hassas verileri dönüştürmek, değiştirmek veya bunları kapsamak için teknik bir yöntemdir. Bu teknik öncelikle hassas verilerin doğrudan güvenilmez ortamlarda kullanılmasını önlemek için kullanılır.
Veri maskeleme prensibi: Veri maskeleme, sonraki geliştirme, test ve veri analizinin maskelemeden etkilenmeyeceğinden emin olmak için orijinal veri özelliklerini, iş kurallarını ve veri alakalı olmasını sağlamalıdır. Maskelemeden önce ve sonra veri tutarlılığını ve geçerliliğini sağlayın.
2. Veri maskeleme sınıflandırması
Veri maskeleme statik veri maskeleme (SDM) ve dinamik veri maskeleme (DDM) olarak bölünebilir.
Statik Veri Maskeleme (SDM): Statik veri maskeleme, üretim ortamından izolasyon için yeni bir üretim dışı ortam veritabanının kurulmasını gerektirir. Hassas veriler üretim veritabanından çıkarılır ve daha sonra üretim dışı veritabanında saklanır. Bu şekilde, duyarsızlaştırılmış veriler, iş ihtiyaçlarını karşılayan ve üretim verilerinin güvenliğini sağlayan üretim ortamından izole edilir.
Dinamik veri maskeleme (DDM): Genellikle üretim ortamında hassas verileri gerçek zamanlı olarak duyarsızlaştırmak için kullanılır. Bazen, farklı durumlarda aynı hassas verileri okumak için farklı maskeleme seviyeleri gerekir. Örneğin, farklı roller ve izinler farklı maskeleme şemaları uygulayabilir.
Veri Raporlama ve Veri Ürünleri Maskeleme Uygulaması
Bu tür senaryolar esas olarak dahili veri izleme ürünleri veya reklam panosu, harici hizmet veri ürünleri ve iş raporları ve proje incelemesi gibi veri analizine dayalı raporları içerir.
3. Veri maskeleme çözümü
Yaygın veri maskeleme şemaları şunları içerir: geçersiz kılma, rastgele değer, veri değiştirme, simetrik şifreleme, ortalama değer, ofset ve yuvarlama, vb.
Geçersiz kılma: Hassasiyet, hassas verilerin şifrelemesini, kesilmesini veya gizlenmesini ifade eder. Bu şema genellikle gerçek verileri özel sembollerle ( *gibi) değiştirir. İşlem basittir, ancak kullanıcılar sonraki veri uygulamalarını etkileyebilecek orijinal verilerin biçimini bilemezler.
Rastgele değer: Rastgele değer, hassas verilerin rastgele değiştirilmesini ifade eder (sayılar rakamları değiştirir, harfleri değiştirir ve karakterler karakterleri değiştirir). Bu maskeleme yöntemi, hassas veri biçimini belirli bir ölçüde sağlayacak ve sonraki veri uygulamasını kolaylaştıracaktır. İnsanların ve yerlerin isimleri gibi bazı anlamlı kelimeler için maskeleme sözlükleri gerekebilir.
Veri değiştirme: Veri değiştirme, özel karakterler veya rastgele değerler kullanmak yerine, maskeleme verilerinin belirli bir değerle değiştirilmesi dışında, boş ve rastgele değerlerin maskelemesine benzer.
Simetrik şifreleme: Simetrik şifreleme özel bir geri dönüşümlü maskeleme yöntemidir. Şifreleme anahtarları ve algoritmaları yoluyla hassas verileri şifreler. Kifirek biçimi, mantıksal kurallardaki orijinal verilerle tutarlıdır.
Ortalama: Ortalama şema genellikle istatistiksel senaryolarda kullanılır. Sayısal veriler için önce ortalamalarını hesaplarız ve daha sonra duyarsızlaştırılmış değerleri rastgele ortalama etrafına dağıtırız, böylece veri toplamını sabit tutarız.
Ofset ve yuvarlama: Bu yöntem dijital verileri rastgele kaydırma ile değiştirir. Ofset yuvarlaması, gerçek verilere önceki şemalardan daha yakın olan ve büyük veri analizi senaryosunda büyük önemi olan verilerin güvenliğini korurken aralığın yaklaşık özgünlüğünü sağlar.
Tavsiye Model "ML-NPB-5660"Veri maskeleme için
4. Yaygın olarak kullanılan veri maskeleme teknikleri
(1). İstatistiksel teknikler
Veri örnekleme ve veri toplama
- Veri Örnekleme: Veri kümesinin temsili bir alt kümesi seçilerek orijinal veri kümesinin analizi ve değerlendirilmesi, tanımlama tekniklerinin etkinliğini artırmak için önemli bir yöntemdir.
- Veri Toplama: Mikro verilerdeki özniteliklere uygulanan istatistiksel tekniklerin (toplam, sayma, ortalaması, ortalaması, maksimum ve minimum gibi) bir koleksiyonu olarak, sonuç orijinal veri setindeki tüm kayıtları temsil eder.
(2). Kriptografi
Kriptografi, duyarsızlaşmanın etkinliğini duyarsızlaştırmak veya arttırmak için yaygın bir yöntemdir. Farklı şifreleme algoritmaları farklı duyarsızlaştırma etkileri elde edebilir.
- Deterministik şifreleme: rastgele olmayan bir simetrik şifreleme. Genellikle kimlik verilerini işler ve şifreleme metnini gerektiğinde orijinal kimliğe şifresini çözebilir ve geri yükleyebilir, ancak anahtarın uygun şekilde korunması gerekir.
- Geri dönüşü olmayan şifreleme: Karma işlevi, genellikle kimlik verileri için kullanılan verileri işlemek için kullanılır. Doğrudan şifre çözülemez ve haritalama ilişkisi kaydedilmelidir. Ayrıca, karma işlevinin özelliği nedeniyle veri çarpışması meydana gelebilir.
- Homomorfik şifreleme: CipherText homomorfik algoritması kullanılır. Karakteristiği, şifreleme işleminin sonucunun, şifre çözme işleminden sonra düz metin işlemiyle aynı olmasıdır. Bu nedenle, sayısal alanları işlemek için yaygın olarak kullanılır, ancak performans nedenleriyle yaygın olarak kullanılmamaktadır.
(3). Sistem teknolojisi
Bastırma teknolojisi, gizlilik korumasını karşılamayan, ancak bunları yayınlamayan veri öğelerini siler veya korur.
- Maskeleme: Rakip numarası, kimlik kartı bir yıldız işareti ile işaretlenir veya adres kesilmiş özellik değerini maskelemek için en yaygın duyarsızlaştırma yöntemini ifade eder.
- Yerel bastırma: belirli özellik değerlerini (sütunlar) silme, gerekli olmayan veri alanlarının kaldırılması işlemini ifade eder;
- Kayıt Bastırma: Belirli kayıtların (satırlar) silinme, gerekli olmayan veri kayıtlarını silme sürecini ifade eder.
(4). Takma ad teknolojisi
Psödomomanning, doğrudan bir tanımlayıcıyı (veya diğer hassas tanımlayıcıyı) değiştirmek için bir takma ad kullanan bir tanımlama tekniğidir. Takma ad teknikleri, doğrudan veya hassas tanımlayıcılar yerine her bir bilgi konusu için benzersiz tanımlayıcılar oluşturur.
- Orijinal kimliğe karşılık gelmek, eşleme tablosunu kaydetmek ve eşleme tablosuna erişimi kesinlikle kontrol etmek için bağımsız olarak rastgele değerler üretebilir.
- Takma adlar üretmek için şifreleme de kullanabilirsiniz, ancak şifre çözme anahtarını düzgün tutmanız gerekir;
Bu teknoloji, farklı geliştiricilerin aynı kullanıcı için farklı openID'ler aldığı açık platform senaryosunda OpenID gibi çok sayıda bağımsız veri kullanıcısı durumunda yaygın olarak kullanılmaktadır.
(5). Genelleme teknikleri
Genelleştirme tekniği, bir veri kümesindeki seçilen niteliklerin ayrıntı düzeyini azaltan ve verilerin daha genel ve soyut bir açıklamasını sağlayan bir tanımlama tekniğini ifade eder. Genelleştirme teknolojisinin uygulanması kolaydır ve kayıt düzeyindeki verilerin gerçekliğini koruyabilir. Veri ürünlerinde veya veri raporlarında yaygın olarak kullanılır.
- Yuvarlama: Yukarı veya aşağı adli tıp gibi seçilen öznitelik için bir yuvarlama tabanının seçilmesini içerir, sonuçlar 100, 500, 1K ve 10K verir
- Üst ve Alt Kodlama Teknikleri: Üst (veya alt) seviyesini temsil eden bir eşikle yukarıdaki (veya alt) değerleri değiştirin, "x'in üstünde" veya "x'in altında" sonucunu verir.
(6). Randomizasyon teknikleri
Bir tür tanımlama tekniği olarak, randomizasyon teknolojisi bir özniteliğin değerini randomizasyon yoluyla değiştirmeyi ifade eder, böylece randomizasyondan sonraki değer orijinal gerçek değerden farklıdır. Bu işlem, bir saldırganın aynı veri kaydındaki diğer öznitelik değerlerinden bir öznitelik değeri elde etme yeteneğini azaltır, ancak üretim testi verileriyle ortak olan elde edilen verilerin gerçekliğini etkiler.
Gönderme Zamanı: 27 Eylül-2022