1. Veri Maskeleme Kavramı
Veri maskeleme, hassas verilerin (örneğin cep telefonu numarası, banka kartı numarası ve diğer bilgiler) maskeleme kuralları ve politikaları belirlendiğinde dönüştürülmesi, değiştirilmesi veya gizlenmesi için kullanılan teknik bir yöntemdir. Bu teknik, öncelikle hassas verilerin güvenilir olmayan ortamlarda doğrudan kullanılmasını önlemek için kullanılır.
Veri Maskeleme Prensibi: Veri maskeleme, orijinal veri özelliklerini, iş kurallarını ve veri alaka düzeyini korumalıdır; böylece sonraki geliştirme, test ve veri analizi işlemleri maskelemeden etkilenmez. Maskelemeden önce ve sonra veri tutarlılığı ve geçerliliği sağlanmalıdır.
2. Veri Maskeleme sınıflandırması
Veri maskeleme, statik veri maskeleme (SDM) ve dinamik veri maskeleme (DDM) olmak üzere ikiye ayrılabilir.
Statik veri maskeleme (SDM)Statik veri maskeleme, üretim ortamından izole etmek için yeni bir üretim dışı ortam veritabanının oluşturulmasını gerektirir. Hassas veriler üretim veritabanından çıkarılır ve daha sonra üretim dışı veritabanına kaydedilir. Bu şekilde, hassasiyeti azaltılmış veriler üretim ortamından izole edilir, bu da iş ihtiyaçlarını karşılar ve üretim verilerinin güvenliğini sağlar.
Dinamik Veri Maskeleme (DDM)Genellikle üretim ortamında hassas verilerin gerçek zamanlı olarak duyarsızlaştırılması için kullanılır. Bazen, farklı durumlarda aynı hassas verileri okumak için farklı maskeleme seviyeleri gerekebilir. Örneğin, farklı roller ve izinler farklı maskeleme şemaları uygulayabilir.
Veri raporlama ve veri ürünleri maskeleme uygulaması
Bu tür senaryolar genellikle dahili veri izleme ürünleri veya panoları, harici hizmet veri ürünleri ve iş raporları ve proje incelemeleri gibi veri analizine dayalı raporları içerir.
3. Veri Maskeleme Çözümü
Yaygın veri maskeleme yöntemleri arasında geçersiz kılma, rastgele değer, veri değiştirme, simetrik şifreleme, ortalama değer, ofset ve yuvarlama vb. yer alır.
Geçersiz kılmaGeçersiz kılma, hassas verilerin şifrelenmesi, kısaltılması veya gizlenmesi anlamına gelir. Bu yöntem genellikle gerçek verileri özel sembollerle (örneğin *) değiştirir. İşlem basittir, ancak kullanıcılar orijinal verilerin biçimini bilemezler; bu da sonraki veri uygulamalarını etkileyebilir.
Rastgele DeğerRastgele değer, hassas verilerin rastgele değiştirilmesini ifade eder (rakamların yerine sayılar, harflerin yerine harfler ve karakterlerin yerine karakterler kullanılır). Bu maskeleme yöntemi, hassas verilerin formatının belirli bir ölçüde korunmasını sağlayacak ve verilerin daha sonraki uygulamalarını kolaylaştıracaktır. Kişi ve yer adları gibi bazı anlamlı kelimeler için maskeleme sözlüklerine ihtiyaç duyulabilir.
Veri DeğiştirmeVeri değiştirme işlemi, boş ve rastgele değerlerin maskelenmesine benzer; ancak özel karakterler veya rastgele değerler yerine, maskeleme verileri belirli bir değerle değiştirilir.
Simetrik ŞifrelemeSimetrik şifreleme, özel ve tersine çevrilebilir bir maskeleme yöntemidir. Hassas verileri şifreleme anahtarları ve algoritmaları aracılığıyla şifreler. Şifrelenmiş metin formatı, mantıksal kurallar çerçevesinde orijinal verilerle tutarlıdır.
OrtalamaOrtalama alma yöntemi genellikle istatistiksel senaryolarda kullanılır. Sayısal veriler için önce ortalamalarını hesaplarız ve ardından duyarsızlaştırılmış değerleri ortalama etrafında rastgele dağıtırız, böylece verilerin toplamını sabit tutarız.
Ofset ve YuvarlamaBu yöntem, dijital verileri rastgele kaydırma yoluyla değiştirir. Ofset yuvarlama, veri güvenliğini korurken aralığın yaklaşık doğruluğunu sağlar; bu da önceki yöntemlere göre gerçek verilere daha yakındır ve büyük veri analizi senaryosunda büyük önem taşır.
Öneri ModeliML-NPB-5660"Veri Maskeleme için"
4. Yaygın Kullanılan Veri Maskeleme Teknikleri
(1). İstatistiksel Teknikler
Veri örneklemesi ve veri toplama
- Veri örneklemesi: Veri kümesinin temsili bir alt kümesini seçerek orijinal veri kümesinin analizi ve değerlendirilmesi, kimliksizleştirme tekniklerinin etkinliğini artırmak için önemli bir yöntemdir.
- Veri toplama: Mikroverilerdeki özelliklere uygulanan istatistiksel tekniklerin (toplama, sayma, ortalama alma, maksimum ve minimum gibi) bir araya getirilmesiyle elde edilen sonuç, orijinal veri kümesindeki tüm kayıtları temsil eder.
(2). Kriptografi
Kriptografi, duyarsızlaştırmanın etkinliğini artırmak veya azaltmak için yaygın olarak kullanılan bir yöntemdir. Farklı şifreleme algoritmaları, farklı duyarsızlaştırma etkileri sağlayabilir.
- Deterministik şifreleme: Rastgele olmayan simetrik bir şifreleme yöntemidir. Genellikle kimlik verilerini işler ve gerektiğinde şifrelenmiş metni çözerek orijinal kimliğe geri döndürebilir, ancak anahtarın uygun şekilde korunması gerekir.
- Geri döndürülemez şifreleme: Verileri işlemek için karma fonksiyonu kullanılır ve bu genellikle kimlik verileri için kullanılır. Doğrudan şifresi çözülemez ve eşleme ilişkisi kaydedilmelidir. Ayrıca, karma fonksiyonunun özelliği nedeniyle veri çakışması meydana gelebilir.
- Homomorfik şifreleme: Şifreli metin homomorfik algoritması kullanılır. Özelliği, şifre çözme işleminden sonra şifreli metin işleminin sonucunun düz metin işleminin sonucuyla aynı olmasıdır. Bu nedenle, genellikle sayısal alanların işlenmesinde kullanılır, ancak performans nedenleriyle yaygın olarak kullanılmamaktadır.
(3). Sistem Teknolojisi
Silme teknolojisi, gizlilik koruma şartlarını karşılamayan veri öğelerini siler veya gizler, ancak yayınlamaz.
- Maskeleme: Rakip numarası, kimlik kartının yıldız işaretiyle işaretlenmesi veya adresin kısaltılması gibi öznitelik değerini maskelemek için kullanılan en yaygın duyarsızlaştırma yöntemini ifade eder.
- Yerel silme: Belirli öznitelik değerlerinin (sütunların) silinmesi, gereksiz veri alanlarının kaldırılması işlemine atıfta bulunur;
- Kayıt silme: Belirli kayıtların (satırların) silinmesi, gereksiz veri kayıtlarının silinmesi işlemine atıfta bulunur.
(4). Takma Ad Teknolojisi
Takma ad kullanma, doğrudan tanımlayıcıyı (veya diğer hassas tanımlayıcıları) bir takma adla değiştiren bir kimliksizleştirme tekniğidir. Takma ad teknikleri, doğrudan veya hassas tanımlayıcılar yerine, her bir bilgi öznesi için benzersiz tanımlayıcılar oluşturur.
- Orijinal kimliğe karşılık gelen rastgele değerleri bağımsız olarak üretebilir, eşleme tablosunu kaydedebilir ve eşleme tablosuna erişimi sıkı bir şekilde kontrol edebilir.
- Şifreleme kullanarak takma adlar da oluşturabilirsiniz, ancak şifre çözme anahtarını düzgün bir şekilde saklamanız gerekir;
Bu teknoloji, açık platform senaryosunda OpenID gibi, çok sayıda bağımsız veri kullanıcısının bulunduğu durumlarda yaygın olarak kullanılmaktadır; bu senaryoda farklı geliştiriciler aynı kullanıcı için farklı OpenID'ler elde ederler.
(5). Genelleme Teknikleri
Genelleme tekniği, bir veri kümesindeki seçili özniteliklerin ayrıntı düzeyini azaltan ve verilerin daha genel ve soyut bir tanımını sağlayan bir kimliksizleştirme tekniğidir. Genelleme teknolojisi uygulaması kolaydır ve kayıt düzeyindeki verilerin orijinalliğini koruyabilir. Genellikle veri ürünlerinde veya veri raporlarında kullanılır.
- Yuvarlama: Seçilen öznitelik için yukarı veya aşağı yuvarlama gibi bir yuvarlama tabanı seçmeyi içerir ve 100, 500, 1K ve 10K gibi sonuçlar verir.
- Üst ve alt kodlama teknikleri: Eşik değerinin üstündeki (veya altındaki) değerleri, üst (veya alt) seviyeyi temsil eden bir eşik değeriyle değiştirerek "X'in üstünde" veya "X'in altında" sonucunu elde edin.
(6). Rastgeleleştirme Teknikleri
Bir tür kimliksizleştirme tekniği olarak rastgeleleştirme teknolojisi, bir özniteliğin değerini rastgeleleştirme yoluyla değiştirmeyi ifade eder; böylece rastgeleleştirme sonrasında elde edilen değer, orijinal gerçek değerden farklı olur. Bu işlem, bir saldırganın aynı veri kaydındaki diğer öznitelik değerlerinden bir öznitelik değerini türetme yeteneğini azaltır, ancak ortaya çıkan verilerin orijinalliğini etkiler; bu durum özellikle üretim test verilerinde yaygındır.
Yayın tarihi: 27 Eylül 2022



