Network Packet Broker'da Veri Maskeleme Teknolojisi ve Çözümü Nedir?

1. Veri Maskeleme Kavramı

Veri maskeleme, veri maskeleme olarak da bilinir. Cep telefonu numarası, banka kartı numarası ve diğer bilgiler gibi hassas verileri maskeleme kuralları ve politikaları verdiğimizde dönüştürmek, değiştirmek veya örtmek için kullanılan teknik bir yöntemdir. Bu teknik, öncelikli olarak hassas verilerin güvenilir olmayan ortamlarda doğrudan kullanılmasını önlemek için kullanılır.

Veri Maskeleme ilkesi: Veri maskeleme, sonraki geliştirme, test ve veri analizinin maskelemeden etkilenmemesini sağlamak için orijinal veri özelliklerini, iş kurallarını ve veri alaka düzeyini korumalıdır. Maskelemeden önce ve sonra veri tutarlılığını ve geçerliliğini sağlayın.

2. Veri Maskeleme sınıflandırması

Veri maskeleme, statik veri maskeleme (SDM) ve dinamik veri maskeleme (DDM) olarak ikiye ayrılabilir.

Statik veri maskeleme (SDM): Statik veri maskeleme, üretim ortamından izolasyon için yeni bir üretim dışı ortam veritabanının kurulmasını gerektirir. Hassas veriler üretim veritabanından çıkarılır ve daha sonra üretim dışı veritabanında saklanır. Bu şekilde duyarsızlaştırılmış veriler üretim ortamından izole edilir, bu da iş ihtiyaçlarını karşılar ve üretim verilerinin güvenliğini sağlar.

SDM

Dinamik Veri Maskeleme (DDM): Genellikle hassas verileri gerçek zamanlı olarak duyarsızlaştırmak için üretim ortamında kullanılır. Bazen, farklı durumlarda aynı hassas verileri okumak için farklı düzeylerde maskeleme gerekir. Örneğin, farklı roller ve izinler farklı maskeleme şemaları uygulayabilir.

DDM

Veri raporlama ve veri ürünleri maskeleme uygulaması

Bu tür senaryolar çoğunlukla iç veri izleme ürünleri veya panoları, dış hizmet veri ürünleri ve iş raporları, proje incelemesi gibi veri analizine dayalı raporları içerir.

veri raporlama ürün maskeleme

3. Veri Maskeleme Çözümü

Yaygın veri maskeleme şemaları şunları içerir: geçersiz kılma, rastgele değer, veri değiştirme, simetrik şifreleme, ortalama değer, ofset ve yuvarlama, vb.

Geçersiz kılma: Geçersiz kılma, hassas verilerin şifrelenmesi, kesilmesi veya gizlenmesi anlamına gelir. Bu şema genellikle gerçek verileri özel sembollerle (örneğin *) değiştirir. İşlem basittir, ancak kullanıcılar orijinal verilerin biçimini bilemezler ve bu da sonraki veri uygulamalarını etkileyebilir.

Rastgele Değer: Rastgele değer, hassas verilerin rastgele değiştirilmesine atıfta bulunur (sayılar rakamların, harfler harflerin ve karakterler karakterlerin yerini alır). Bu maskeleme yöntemi, hassas verilerin biçimini belirli bir ölçüde garanti altına alacak ve sonraki veri uygulamasını kolaylaştıracaktır. Kişi ve yer adları gibi bazı anlamlı kelimeler için maskeleme sözlüklerine ihtiyaç duyulabilir.

Veri Değişimi: Veri değiştirme, boş ve rastgele değerlerin maskelenmesine benzer; tek fark, özel karakterler veya rastgele değerler kullanmak yerine, maskeleme verilerinin belirli bir değerle değiştirilmesidir.

Simetrik Şifreleme: Simetrik şifreleme, özel bir geri dönüşümlü maskeleme yöntemidir. Hassas verileri şifreleme anahtarları ve algoritmaları aracılığıyla şifreler. Şifreli metin biçimi, mantıksal kurallardaki orijinal verilerle tutarlıdır.

Ortalama: Ortalama şeması genellikle istatistiksel senaryolarda kullanılır. Sayısal veriler için, önce ortalamalarını hesaplarız ve sonra duyarsızlaştırılmış değerleri ortalamanın etrafına rastgele dağıtırız, böylece verilerin toplamını sabit tutarız.

Ofset ve Yuvarlatma: Bu yöntem, dijital verileri rastgele kaydırma yoluyla değiştirir. Ofset yuvarlama, önceki şemalara göre gerçek verilere daha yakın olan ve büyük veri analizi senaryosunda büyük öneme sahip olan verilerin güvenliğini korurken aralığın yaklaşık gerçekliğini sağlar.

ML-NPB-5660-Kullanım Kılavuzu

Önerilen Model "ML-NPB-5660" Veri Maskeleme için

4. Yaygın olarak kullanılan Veri Maskeleme Teknikleri

(1). İstatistiksel Teknikler

Veri örneklemesi ve veri toplama

- Veri örneklemesi: Orijinal veri setinin temsili bir alt kümesini seçerek analiz edilmesi ve değerlendirilmesi, kimliksizleştirme tekniklerinin etkinliğini artırmak için önemli bir yöntemdir.

- Veri toplama: Mikro verilerdeki niteliklere uygulanan istatistiksel tekniklerin (toplama, sayma, ortalama alma, maksimum ve minimum gibi) bir koleksiyonu olarak, sonuç orijinal veri kümesindeki tüm kayıtları temsil eder.

(2). Kriptografi

Kriptografi duyarsızlaştırmanın etkinliğini artırmak veya duyarsızlaştırmayı azaltmak için yaygın bir yöntemdir. Farklı şifreleme algoritmaları farklı duyarsızlaştırma etkileri elde edebilir.

- Deterministik şifreleme: Rastgele olmayan simetrik bir şifreleme. Genellikle kimlik verilerini işler ve gerektiğinde şifreli metni orijinal kimliğe geri yükleyebilir, ancak anahtarın düzgün bir şekilde korunması gerekir.

- Geri döndürülemez şifreleme: Karma işlevi, genellikle kimlik verileri için kullanılan verileri işlemek için kullanılır. Doğrudan şifresi çözülemez ve eşleme ilişkisi kaydedilmelidir. Ayrıca, karma işlevinin özelliği nedeniyle veri çakışması meydana gelebilir.

- Homomorfik şifreleme: Şifreli metin homomorfik algoritması kullanılır. Özelliği, şifreli metin işleminin sonucunun şifre çözme işleminden sonra düz metin işleminin sonucuyla aynı olmasıdır. Bu nedenle, sayısal alanları işlemek için yaygın olarak kullanılır, ancak performans nedenleriyle yaygın olarak kullanılmaz.

(3). Sistem Teknolojisi

Bastırma teknolojisi, gizlilik korumasını karşılamayan veri öğelerini siler veya korur, ancak bunları yayınlamaz.

- Maskeleme: Rakip numaranın, kimlik kartının yıldız işaretiyle işaretlenmesi veya adresin kesilmesi gibi nitelik değerini maskelemek için en yaygın duyarsızlaştırma yöntemini ifade eder.

- Yerel bastırma: Belirli öznitelik değerlerinin (sütunların) silinmesi, gerekli olmayan veri alanlarının kaldırılması sürecini ifade eder;

- Kayıt bastırma: Belirli kayıtların (satırların) silinmesi, gerekli olmayan veri kayıtlarının silinmesi sürecini ifade eder.

(4). Takma Ad Teknolojisi

Sahte kimliklendirme, doğrudan bir tanımlayıcıyı (veya diğer hassas tanımlayıcıyı) değiştirmek için bir takma ad kullanan bir kimliksizleştirme tekniğidir. Sahte kimliklendirme teknikleri, doğrudan veya hassas tanımlayıcılar yerine, her bir bilgi konusu için benzersiz tanımlayıcılar oluşturur.

- Orijinal kimliğe karşılık gelecek şekilde bağımsız olarak rastgele değerler üretebilir, eşleme tablosunu kaydedebilir ve eşleme tablosuna erişimi sıkı bir şekilde kontrol edebilir.

- Takma adlar üretmek için şifreleme de kullanabilirsiniz, ancak şifre çözme anahtarını düzgün bir şekilde saklamanız gerekir;

Bu teknoloji, açık platform senaryosunda farklı geliştiricilerin aynı kullanıcı için farklı OpenID'ler edindiği OpenID gibi çok sayıda bağımsız veri kullanıcısı olması durumunda yaygın olarak kullanılır.

(5). Genelleme Teknikleri

Genelleme tekniği, bir veri kümesindeki seçili niteliklerin ayrıntı düzeyini azaltan ve verilerin daha genel ve soyut bir tanımını sağlayan bir kimliksizleştirme tekniğini ifade eder. Genelleme teknolojisinin uygulanması kolaydır ve kayıt düzeyindeki verilerin gerçekliğini koruyabilir. Genellikle veri ürünlerinde veya veri raporlarında kullanılır.

- Yuvarlama: Seçilen öznitelik için yukarı veya aşağı doğru adli incelemeler gibi bir yuvarlama tabanının seçilmesini içerir ve 100, 500, 1K ve 10K sonuçları verir

- Üst ve alt kodlama teknikleri: Eşiğin üstündeki (veya altındaki) değerleri, en üst (veya en alt) seviyeyi temsil eden bir eşikle değiştirin ve "X'in üstünde" veya "X'in altında" sonucunu elde edin.

(6). Rastgeleleştirme Teknikleri

Bir tür kimliksizleştirme tekniği olarak, rastgeleleştirme teknolojisi, rastgeleleştirme yoluyla bir niteliğin değerini değiştirmeyi ifade eder, böylece rastgeleleştirmeden sonraki değer orijinal gerçek değerden farklı olur. Bu süreç, bir saldırganın aynı veri kaydındaki diğer nitelik değerlerinden bir nitelik değeri türetme yeteneğini azaltır, ancak üretim test verilerinde yaygın olan sonuç verilerinin gerçekliğini etkiler.


Gönderi zamanı: 27-Eyl-2022