Apakah Teknologi dan Penyelesaian Pelindungan Data dalam Broker Paket Rangkaian?

1. Konsep Penyamaran Data

Penyamaran data juga dikenali sebagai penyamaran data. Ia merupakan kaedah teknikal untuk menukar, mengubah suai atau menutup data sensitif seperti nombor telefon bimbit, nombor kad bank dan maklumat lain apabila kita telah memberikan peraturan dan dasar penyamaran. Teknik ini digunakan terutamanya untuk mengelakkan data sensitif daripada digunakan secara langsung dalam persekitaran yang tidak boleh dipercayai.

Prinsip Penyamaran Data: Penyamaran data harus mengekalkan ciri-ciri data asal, peraturan perniagaan dan kerelevanan data bagi memastikan pembangunan, pengujian dan analisis data seterusnya tidak akan terjejas oleh penyamaran. Pastikan konsistensi dan kesahan data sebelum dan selepas penyamaran.

2. Pengelasan Pelindungan Data

Penyamaran data boleh dibahagikan kepada penyamaran data statik (SDM) dan penyamaran data dinamik (DDM).

Pelindungan data statik (SDM)Penyamaran data statik memerlukan penubuhan pangkalan data persekitaran bukan pengeluaran baharu untuk pengasingan daripada persekitaran pengeluaran. Data sensitif diekstrak daripada pangkalan data pengeluaran dan kemudian disimpan dalam pangkalan data bukan pengeluaran. Dengan cara ini, data yang tidak sensitif diasingkan daripada persekitaran pengeluaran, yang memenuhi keperluan perniagaan dan memastikan keselamatan data pengeluaran.

SDM

Pelindungan Data Dinamik (DDM)Ia biasanya digunakan dalam persekitaran pengeluaran untuk mengurangkan sensitiviti data sensitif dalam masa nyata. Kadangkala, tahap penyamaran yang berbeza diperlukan untuk membaca data sensitif yang sama dalam situasi yang berbeza. Contohnya, peranan dan kebenaran yang berbeza mungkin melaksanakan skema penyamaran yang berbeza.

DDM

Pelaporan data dan aplikasi penyamaran produk data

Senario sedemikian terutamanya merangkumi produk pemantauan data dalaman atau papan iklan, produk data perkhidmatan luaran dan laporan berdasarkan analisis data, seperti laporan perniagaan dan semakan projek.

penyamaran produk pelaporan data

3. Penyelesaian Pelindungan Data

Skema penyamaran data biasa termasuk: pembatalan, nilai rawak, penggantian data, penyulitan simetri, nilai purata, ofset dan pembundaran, dsb.

PembatalanPembatalan merujuk kepada penyulitan, pemotongan atau penyembunyian data sensitif. Skema ini biasanya menggantikan data sebenar dengan simbol khas (seperti *). Operasi ini mudah, tetapi pengguna tidak dapat mengetahui format data asal, yang mungkin menjejaskan aplikasi data seterusnya.

Nilai RawakNilai rawak merujuk kepada penggantian rawak data sensitif (nombor menggantikan digit, huruf menggantikan huruf, dan aksara menggantikan aksara). Kaedah penyamaran ini akan memastikan format data sensitif sehingga tahap tertentu dan memudahkan aplikasi data seterusnya. Kamus penyamaran mungkin diperlukan untuk beberapa perkataan yang bermakna, seperti nama orang dan tempat.

Penggantian DataPenggantian data adalah serupa dengan penyamaran nilai nol dan rawak, kecuali data penyamaran digantikan dengan nilai tertentu dan bukannya menggunakan aksara khas atau nilai rawak.

Penyulitan SimetriPenyulitan simetri ialah kaedah penyamaran berbalik khas. Ia menyulitkan data sensitif melalui kunci dan algoritma penyulitan. Format teks sifer adalah konsisten dengan data asal dalam peraturan logik.

PurataSkema purata sering digunakan dalam senario statistik. Untuk data berangka, kita mula-mula mengira minnya, dan kemudian mengagihkan nilai yang tidak peka secara rawak di sekitar min, sekali gus mengekalkan jumlah data yang malar.

Ofset dan PembundaranKaedah ini mengubah data digital melalui anjakan rawak. Pembundaran ofset memastikan anggaran kesahihan julat sambil mengekalkan keselamatan data, yang lebih hampir dengan data sebenar berbanding skema sebelumnya, dan mempunyai kepentingan yang besar dalam senario analisis data raya.

ML-NPB-5660-数据脱敏

Model Cadangan "ML-NPB-5660" untuk Penyamaran Data

4. Teknik Penyamaran Data yang Biasa Digunakan

(1). Teknik Statistik

Pensampelan data dan pengagregatan data

- Pensampelan data: Analisis dan penilaian set data asal dengan memilih subset perwakilan set data merupakan kaedah penting untuk meningkatkan keberkesanan teknik penyahidentifikasian.

- Pengagregatan data: Sebagai koleksi teknik statistik (seperti penjumlahan, pengiraan, purata, maksimum dan minimum) yang digunakan pada atribut dalam mikrodata, hasilnya mewakili semua rekod dalam set data asal.

(2). Kriptografi

Kriptografi merupakan kaedah biasa untuk mengurangkan atau meningkatkan keberkesanan penyahpekaan. Pelbagai jenis algoritma penyulitan boleh mencapai kesan penyahpekaan yang berbeza.

- Penyulitan deterministik: Penyulitan simetri bukan rawak. Ia biasanya memproses data ID dan boleh menyahsulit serta memulihkan teks sifer kepada ID asal apabila perlu, tetapi kunci perlu dilindungi dengan betul.

- Penyulitan tidak boleh diterbalikkan: Fungsi hash digunakan untuk memproses data, yang biasanya digunakan untuk data ID. Ia tidak boleh dinyahsulit secara langsung dan hubungan pemetaan mesti disimpan. Di samping itu, disebabkan oleh ciri fungsi hash, perlanggaran data mungkin berlaku.

- Penyulitan homomorfik: Algoritma homomorfik siferteks digunakan. Cirinya ialah hasil operasi siferteks adalah sama seperti operasi teks biasa selepas penyahsulitan. Oleh itu, ia biasanya digunakan untuk memproses medan berangka, tetapi ia tidak digunakan secara meluas atas sebab prestasi.

(3). Teknologi Sistem

Teknologi penindasan memadam atau melindungi item data yang tidak memenuhi perlindungan privasi, tetapi tidak menerbitkannya.

- Masking: ia merujuk kepada kaedah desensitisasi yang paling biasa untuk menutup nilai atribut, seperti nombor lawan, kad pengenalan ditanda dengan asterisk atau alamat dipendekkan.

- Penindasan setempat: merujuk kepada proses memadam nilai atribut tertentu (lajur), mengalih keluar medan data yang tidak penting;

- Penindasan rekod: merujuk kepada proses memadam rekod (baris) tertentu, memadam rekod data yang tidak penting.

(4). Teknologi Nama Samaran

Pseudomanning ialah teknik penyahidentifikasian yang menggunakan nama samaran untuk menggantikan pengecam langsung (atau pengecam sensitif yang lain). Teknik nama samaran mencipta pengecam unik untuk setiap subjek maklumat individu, bukannya pengecam langsung atau sensitif.

- Ia boleh menjana nilai rawak secara bebas untuk sepadan dengan ID asal, menyimpan jadual pemetaan, dan mengawal akses ke jadual pemetaan dengan ketat.

- Anda juga boleh menggunakan penyulitan untuk menghasilkan nama samaran, tetapi perlu menyimpan kunci penyahsulitan dengan betul;

Teknologi ini digunakan secara meluas dalam kes sebilangan besar pengguna data bebas, seperti OpenID dalam senario platform terbuka, di mana pembangun yang berbeza memperoleh Openid yang berbeza untuk pengguna yang sama.

(5). Teknik Pengitlakan

Teknik generalisasi merujuk kepada teknik penyahidentifikasian yang mengurangkan kebutiran atribut yang dipilih dalam set data dan memberikan penerangan data yang lebih umum dan abstrak. Teknologi generalisasi mudah dilaksanakan dan boleh melindungi kesahihan data peringkat rekod. Ia biasanya digunakan dalam produk data atau laporan data.

- Pembundaran: melibatkan pemilihan asas pembundaran untuk atribut yang dipilih, seperti forensik ke atas atau ke bawah, menghasilkan keputusan 100, 500, 1K dan 10K

- Teknik pengekodan atas dan bawah: Gantikan nilai di atas (atau di bawah) ambang dengan ambang yang mewakili aras atas (atau bawah), menghasilkan hasil "di atas X" atau "di bawah X"

(6). Teknik Rawak

Sebagai sejenis teknik penyah-identifikasian, teknologi pengacakan merujuk kepada pengubahsuaian nilai atribut melalui pengacakan, supaya nilai selepas pengacakan berbeza daripada nilai sebenar asal. Proses ini mengurangkan keupayaan penyerang untuk memperoleh nilai atribut daripada nilai atribut lain dalam rekod data yang sama, tetapi menjejaskan kesahihan data yang terhasil, yang lazimnya berlaku dengan data ujian pengeluaran.


Masa siaran: 27 Sep-2022