Chagua Lugha

Kujifunza kwa Mashine kwenye Data ya Blockchain: Uchambuzi wa Utafiti wa Ramani ya Utaratibu

Uchambuzi kamili wa karatasi 179 za utafiti zinazotumia kujifunza kwa mashine kwenye data ya blockchain, kujumuisha matumizi, mbinu, na mwelekeo wa utafiti wa baadaye.
aicomputecoin.org | PDF Size: 0.8 MB
Ukadiriaji: 4.5/5
Ukadiriaji Wako
Umekadiria waraka huu tayari
Kifuniko cha Waraka PDF - Kujifunza kwa Mashine kwenye Data ya Blockchain: Uchambuzi wa Utafiti wa Ramani ya Utaratibu

Yaliyomo

Karatasi 179 Zilizochambuliwa

Ukaguzi kamili wa vitabu kutoka 2008-2023

49.7% Ugunduzi wa Ukiukaji

Kesi kuu ya matumizi katika programu za ML za blockchain

47.2% Mwelekeo kwa Bitcoin

Jukwaa kuu la blockchain lililosomwa

46.5% Kazi za Uainishaji

Mbinu ya kawaida zaidi ya ML

1.1 Utangulizi

Teknolojia ya blockchain imebadilisha kabisa uwazi na upatikanaji wa data, ikiunda seti kubwa za data zinazotoa fursa isiyo na kifani kwa matumizi ya kujifunza kwa mashine. Utafiti huu wa utengenezaji ramani wa utaratibu unachambua karatasi 179 za utafiti kuanzia 2008-2023, ukitoa muhtasari kamili wa jinsi ML inavyotumika kwenye data ya blockchain katika nyanja mbalimbali.

1.2 Mbinu ya Utafiti

Utafiti huu unafuata mbinu madhubuti ya utengenezaji ramani wa utaratibu kama ilivyoelezewa na Petersen et al. (2015) na Kitchenham & Charters (2007). Mfumo wa uainishaji hupanga tafiti katika mwelekeo muhimu manne: Kesi ya Matumizi, Jukwaa la Blockchain, Sifa za Data, na Kazi za Kujifunza kwa Mashine.

2. Matokeo Muhimu

2.1 Usambazaji wa Kesi za Matumizi

Uchambuzi unaonyesha kuwa ugunduzi wa ukiukaji ndio unaotawala eneo la utafiti, ukiwa na asilimia 49.7 ya tafiti zote. Hii inajumuisha ugunduzi wa udanganyifu, utambuzi wa vitisho vya usalama, na utambuzi wa muundo wenye tuhuma katika shughuli za blockchain.

2.2 Uchambuzi wa Jukwaa za Blockchain

Bitcoin bado ndio jukwaa la blockchain linalosomwa zaidi (47.2%), ikifuatiwa na Ethereum (28.9%) na jukwaa zingine. Mkusanyiko huu unaonyesha ukomavu wa Bitcoin na historia yake kubwa ya shughuli.

2.3 Sifa za Data

Asilimia 31.4 ya tafiti zilitumia seti za data zenye vidokezo zaidi ya 1,000,000 vya data, zikionyesha mahitaji ya uwezo wa kupanuka kwa programu za ML za blockchain. Aina za data zinajumuisha michoro ya shughuli, mfuatano wa kitampo, na vekta za sifa zilizochakatwa kutoka kwa metadata ya blockchain.

2.4 Miundo na Kazi za ML

Kazi za uainishaji zinaongoza kwa asilimia 46.5, huku kusanya kundi (22.6%) na rejeshi (18.9) zikifuata. Mbinu za kujifunza kwa kina, hasa Mitandao ya Neural ya Grafiki (GNNs), zinaonyesha kupitishwa kwa kasi kwa kuchambua michoro ya shughuli za blockchain.

3. Utekelezaji wa Kiufundi

3.1 Msingi wa Kihisabati

Programu za ML za blockchain mara nyingi hutumia algoriti za kujifunza kulingana na grafu. Operesheni ya msingi ya kukunja grafu inaweza kuonyeshwa kama:

$H^{(l+1)} = \sigma(\tilde{D}^{-\frac{1}{2}}\tilde{A}\tilde{D}^{-\frac{1}{2}}H^{(l)}W^{(l)})$

ambapo $\tilde{A} = A + I$ ni matriki ya ukaribu yenye miunganisho ya kibinafsi, $\tilde{D}$ ni matriki ya kiwango, $H^{(l)}$ ina sifa za nodi kwenye safu $l$, na $W^{(l)}$ ni matriki inayoweza kufundishwa ya uzito.

3.2 Utekelezaji wa Msimbo

import torch
import torch.nn as nn
import torch.nn.functional as F

class BlockchainGNN(nn.Module):
    def __init__(self, input_dim, hidden_dim, output_dim):
        super(BlockchainGNN, self).__init__()
        self.conv1 = GCNConv(input_dim, hidden_dim)
        self.conv2 = GCNConv(hidden_dim, output_dim)
        
    def forward(self, data):
        x, edge_index = data.x, data.edge_index
        x = F.relu(self.conv1(x, edge_index))
        x = F.dropout(x, training=self.training)
        x = self.conv2(x, edge_index)
        return F.log_softmax(x, dim=1)

# Matumizi ya mfano kwa ugunduzi wa ukiukaji wa shughuli
model = BlockchainGNN(input_dim=64, hidden_dim=32, output_dim=2)
optimizer = torch.optim.Adam(model.parameters(), lr=0.01)

4. Matokeo ya Majaribio

Utafiti unaonyesha tofauti kubwa za utendaji katika mbinu tofauti za ML. Miundo ya ugunduzi wa ukiukaji ilipata alama za wastani za F1 za 0.78-0.92, huku miundo ya utabiri wa bei ikionyesha MAPE (Kosa la Asilimia Kabisa la Wastani) kuanzia asilimia 8.3 hadi 15.7. Utendaji hutegemea sana ubora wa data, uhandisi wa sifa, na uteuzi wa muundo wa modeli.

5. Uchambuzi Muhimu

Muhtasari wa Sentensi Moja:

Utafiti huu wa ramani unaonyesha eneo linalotawaliwa na ugunduzi wa ukiukaji uliolenga Bitcoin, ukifunua ukomavu wa programu fulani na pengo kubwa katika ushirikiano wa mnyororo mwingi na ukuzaji wa algoriti mpya.

Mnyororo wa Kimantiki:

Utafiti huu unafuata mnyororo wazi wa sababu na athari: uwazi wa blockchain → seti kubwa za data za umma → fursa ya ML → mkusanyiko wa sasa kwenye matunda yaliyo chini (ugunduzi wa ukiukaji) → hitaji linaloibuka la mbinu za hali ya juu za mnyororo mwingi na za ML mpya.

Vipande Vilivyoangazika na Maeneo Magumu:

Vipande Vilivyoangazika: Ufunuo kamili wa karatasi 179, mbinu madhubuti na wazi, utambuzi wa utawala wa Bitcoin (47.2%) na mwelekeo wa ugunduzi wa ukiukaji (49.7%).

Maeneo Magumu: Kutegemea kupita kiasi data ya Bitcoin, ukosefu wa mifumo ya kiwango, uchunguzi mdogo wa miundo mpya ya ML kama vile vigeuzi kwa data ya kitampo, na uchambuzi mdogo wa mnyororo mwingi.

Taarifa Zinazoweza Kutekelezwa:

Watafiti wanapaswa kuelekea kwenye Ethereum na minyororo inayoibuka, kutengeneza mifumo ya ML ya mnyororo mwingi, na kuchunguza miundo mpya. Watendaji wanapaswa kutumia miundo thabiti ya ugunduzi wa ukiukaji huku wakikipigia kura kiwango.

6. Mwelekeo wa Baadaye

Utafiti huu unabainisha mwelekeo muhimu manne ya utafiti: algoriti mpya za kujifunza kwa mashine zilizobuniwa mahsusi kwa sifa za data ya blockchain, mifumo ya kiwango kwa usindikaji wa data na tathmini ya modeli, suluhisho kwa maswala ya uwezo wa kupanuka wa blockchain katika miktadha ya ML, na uchambuzi wa mwingiliano wa mnyororo mwingi. Maeneo yanayoibuka yanajumuisha kujifunza kwa shirikishi kwa data ya blockchain ya faragha na kujifunza kwa uimarishaji kwa programu za fedha zisizo na mtawala.

7. Marejeo

  1. Palaiokrassas, G., Bouraga, S., & Tassiulas, L. (2024). Machine Learning on Blockchain Data: A Systematic Mapping Study. arXiv:2403.17081
  2. Petersen, K., Vakkalanka, S., & Kuzniarz, L. (2015). Guidelines for conducting systematic mapping studies in software engineering. Information and Software Technology, 64, 1-18.
  3. Zhu, J. Y., et al. (2017). Unpaired image-to-image translation using cycle-consistent adversarial networks. Proceedings of the IEEE international conference on computer vision.
  4. Kipf, T. N., & Welling, M. (2016). Semi-supervised classification with graph convolutional networks. arXiv:1609.02907
  5. Nakamoto, S. (2008). Bitcoin: A peer-to-peer electronic cash system.