1. Veri Maskeleme Kavramı
Veri maskeleme aynı zamanda veri maskeleme olarak da bilinir. Maskeleme kuralları ve politikalarını verdiğimizde, cep telefonu numarası, banka kartı numarası ve diğer bilgiler gibi hassas verileri dönüştürmek, değiştirmek veya gizlemek için kullanılan teknik bir yöntemdir. Bu teknik öncelikle hassas verilerin güvenilmez ortamlarda doğrudan kullanılmasını önlemek için kullanılır.
Veri Maskeleme ilkesi: Veri maskeleme, sonraki geliştirme, test ve veri analizinin maskelemeden etkilenmemesini sağlamak için orijinal veri özelliklerini, iş kurallarını ve veri ilgisini korumalıdır. Maskelemeden önce ve sonra veri tutarlılığını ve geçerliliğini sağlayın.
2. Veri Maskeleme sınıflandırması
Veri maskeleme, statik veri maskeleme (SDM) ve dinamik veri maskeleme (DDM) olarak ikiye ayrılabilir.
Statik veri maskeleme (SDM): Statik veri maskeleme, üretim ortamından izolasyon için yeni bir üretim dışı ortam veritabanının oluşturulmasını gerektirir. Hassas veriler üretim veritabanından çıkarılır ve ardından üretim dışı veritabanında saklanır. Bu şekilde duyarsızlaştırılan veriler, iş ihtiyaçlarını karşılayan ve üretim verilerinin güvenliğini sağlayan üretim ortamından izole edilir.
Dinamik Veri maskeleme (DDM): Genellikle üretim ortamında hassas verileri gerçek zamanlı olarak duyarsızlaştırmak için kullanılır. Bazen aynı hassas veriyi farklı durumlarda okumak için farklı düzeylerde maskeleme gerekebilir. Örneğin, farklı roller ve izinler farklı maskeleme düzenleri uygulayabilir.
Veri raporlama ve veri ürünleri maskeleme uygulaması
Bu tür senaryolar temel olarak dahili veri izleme ürünlerini veya reklam panosunu, harici hizmet veri ürünlerini ve iş raporları ve proje incelemesi gibi veri analizine dayalı raporları içerir.
3. Veri Maskeleme Çözümü
Yaygın veri maskeleme şemaları şunları içerir: geçersiz kılma, rastgele değer, veri değiştirme, simetrik şifreleme, ortalama değer, dengeleme ve yuvarlama vb.
Geçersiz kılma: Geçersiz kılma, hassas verilerin şifrelenmesini, kesilmesini veya gizlenmesini ifade eder. Bu şema genellikle gerçek verileri özel simgelerle (* gibi) değiştirir. İşlem basittir ancak kullanıcılar orijinal verinin formatını bilemez ve bu durum daha sonraki veri uygulamalarını etkileyebilir.
Rastgele Değer: Rasgele değer, hassas verilerin rastgele değiştirilmesini ifade eder (rakamların yerine sayılar, harflerin yerine harfler ve karakterlerin yerine karakterler). Bu maskeleme yöntemi hassas verilerin formatını belli ölçüde sağlayacak ve daha sonraki veri uygulamalarını kolaylaştıracaktır. Kişi ve yer isimleri gibi bazı anlamlı kelimeler için maskeleme sözlüklerine ihtiyaç duyulabilir.
Veri Değiştirme: Veri değiştirme, boş ve rastgele değerlerin maskelenmesine benzer; tek fark, özel karakterler veya rastgele değerler kullanmak yerine maskeleme verilerinin belirli bir değerle değiştirilmesidir.
Simetrik Şifreleme: Simetrik şifreleme özel bir geri dönüşümlü maskeleme yöntemidir. Hassas verileri şifreleme anahtarları ve algoritmaları aracılığıyla şifreler. Şifreli metin formatı, mantıksal kurallardaki orijinal verilerle tutarlıdır.
Ortalama: Ortalama şema genellikle istatistiksel senaryolarda kullanılır. Sayısal veriler için öncelikle ortalamalarını hesaplıyoruz ve daha sonra duyarsızlaştırılmış değerleri ortalamanın etrafına rastgele dağıtıyoruz, böylece verilerin toplamını sabit tutuyoruz.
Ofset ve Yuvarlama: Bu yöntem dijital verileri rastgele kaydırmayla değiştirir. Ofset yuvarlama, önceki şemalara göre gerçek verilere daha yakın olan ve büyük veri analizi senaryosunda büyük öneme sahip olan verilerin güvenliğini korurken aralığın yaklaşık orijinalliğini sağlar.
Önerilen Model"ML-NPB-5660" Veri Maskeleme için
4. Yaygın Olarak Kullanılan Veri Maskeleme Teknikleri
(1). İstatistiksel Teknikler
Veri örnekleme ve veri toplama
- Veri örnekleme: Veri setinin temsili bir alt kümesini seçerek orijinal veri setinin analizi ve değerlendirilmesi, kimlik gizleme tekniklerinin etkinliğini artırmak için önemli bir yöntemdir.
- Veri toplama: Mikro verilerdeki niteliklere uygulanan istatistiksel tekniklerin (toplam, sayma, ortalama, maksimum ve minimum gibi) bir koleksiyonu olarak sonuç, orijinal veri setindeki tüm kayıtları temsil eder.
(2). Kriptografi
Kriptografi, duyarsızlaştırmanın etkinliğini duyarsızlaştırmaya veya artırmaya yönelik yaygın bir yöntemdir. Farklı türde şifreleme algoritmaları farklı duyarsızlaştırma etkileri elde edebilir.
- Deterministik şifreleme: Rastgele olmayan simetrik bir şifreleme. Genellikle kimlik verilerini işler ve gerektiğinde şifreli metnin şifresini çözebilir ve orijinal kimliğe geri yükleyebilir, ancak anahtarın uygun şekilde korunması gerekir.
- Geri dönüşü olmayan şifreleme: Genellikle kimlik verileri için kullanılan karma işlevi, verileri işlemek için kullanılır. Doğrudan şifresi çözülemez ve eşleme ilişkisinin kaydedilmesi gerekir. Ayrıca hash fonksiyonunun özelliğinden dolayı veri çakışması meydana gelebilir.
- Homomorfik şifreleme: Şifreli metin homomorfik algoritması kullanılır. Özelliği, şifreli metin işleminin sonucunun, şifre çözme sonrasındaki düz metin işlemiyle aynı olmasıdır. Bu nedenle sayısal alanları işlemek için yaygın olarak kullanılır, ancak performans nedenleriyle yaygın olarak kullanılmaz.
(3). Sistem Teknolojisi
Bastırma teknolojisi, gizlilik korumasını karşılamayan veri öğelerini siler veya korur, ancak bunları yayınlamaz.
- Maskeleme: Rakibin numarası, kimlik kartının yıldız işaretiyle işaretlenmesi veya adresin kısaltılması gibi nitelik değerlerini maskelemek için en yaygın duyarsızlaştırma yöntemini ifade eder.
- Yerel bastırma: belirli nitelik değerlerinin (sütunlar) silinmesi, gerekli olmayan veri alanlarının kaldırılması sürecini ifade eder;
- Kayıt bastırma: Belirli kayıtların (satırların) silinmesi, gerekli olmayan veri kayıtlarının silinmesi işlemini ifade eder.
(4). Takma Ad Teknolojisi
Sahte personel kullanımı, doğrudan bir tanımlayıcının (veya başka bir hassas tanımlayıcının) yerine takma ad kullanan bir kimlik gizleme tekniğidir. Takma ad teknikleri, doğrudan veya hassas tanımlayıcılar yerine her bir bilgi sahibi için benzersiz tanımlayıcılar oluşturur.
- Orijinal kimliğe karşılık gelecek şekilde bağımsız olarak rastgele değerler üretebilir, eşleme tablosunu kaydedebilir ve eşleme tablosuna erişimi sıkı bir şekilde kontrol edebilir.
- Şifrelemeyi takma adlar oluşturmak için de kullanabilirsiniz, ancak şifre çözme anahtarını düzgün bir şekilde saklamanız gerekir;
Bu teknoloji, farklı geliştiricilerin aynı kullanıcı için farklı OpenID'ler elde ettiği açık platform senaryosunda OpenID gibi çok sayıda bağımsız veri kullanıcısı durumunda yaygın olarak kullanılır.
(5). Genelleme Teknikleri
Genelleştirme tekniği, bir veri kümesinde seçilen niteliklerin ayrıntı düzeyini azaltan ve verilerin daha genel ve soyut bir tanımını sağlayan bir kimliksizleştirme tekniğini ifade eder. Genelleştirme teknolojisinin uygulanması kolaydır ve kayıt düzeyindeki verilerin orijinalliğini koruyabilir. Veri ürünlerinde veya veri raporlarında yaygın olarak kullanılır.
- Yuvarlama: 100, 500, 1K ve 10K sonuçları veren, seçilen nitelik için yukarı veya aşağı adli tıp gibi bir yuvarlama tabanının seçilmesini içerir
- Üst ve alt kodlama teknikleri: Eşiğin üstündeki (veya altındaki) değerleri, üst (veya alt) düzeyi temsil eden bir eşik ile değiştirin; "X'in üstü" veya "X'in altı" sonucu elde edilir.
(6). Rastgeleleştirme Teknikleri
Bir tür kimliksizleştirme tekniği olarak rastgeleleştirme teknolojisi, bir özelliğin değerinin rastgeleleştirme yoluyla değiştirilmesini ifade eder, böylece rastgeleleştirmeden sonraki değer orijinal gerçek değerden farklı olur. Bu süreç, bir saldırganın aynı veri kaydındaki diğer nitelik değerlerinden bir nitelik değeri elde etme yeteneğini azaltır, ancak üretim testi verilerinde ortak olan, ortaya çıkan verilerin orijinalliğini etkiler.
Gönderim zamanı: Eylül-27-2022