成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<rt id="4y2oy"></rt>

<rt id="4y2oy"><acronym id="4y2oy"></acronym></rt>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

驚呆了！在 Jupyter 中用鼠標“畫”出數據集

作者：云朵君 2025-04-02 00:45:00

開發項目管理

DrawData 的出現，讓數據生成從一項繁瑣的編程任務變成了一個充滿創造力的過程。無論你是數據科學家、教育工作者，還是機器學習愛好者，這個庫都能讓你的工作更加高效。

你是否曾在數據科學項目中為生成一個符合需求的數據集而頭疼？比如，當你需要演示一個清晰的聚類算法時，卻發現隨機生成的數據點雜亂無章；或者當你試圖展示一個非線性決策邊界時，手動調整參數卻始終無法達到理想效果。傳統的數據生成方法往往需要編寫冗長的代碼、反復調試分布參數，甚至還要依賴運氣才能得到滿意的結果。

直到我發現了 DrawData——這個神奇的 Python 庫徹底改變了我的數據生成方式。它允許你像在白板上作畫一樣，用鼠標直接繪制數據集，幾秒鐘內就能得到符合你預期的數據分布。無論是用于教學演示、算法測試，還是機器學習模型的原型設計，DrawData 都能讓你的工作變得更加高效和有趣。

DrawData 發現之旅

最近負責一個機器學習入門研討會，需要準備一些直觀的案例來演示聚類、分類和回歸算法。我希望數據集能清晰展現不同算法的特點——比如完美的球形簇、螺旋分布，或者經典的 XOR 模式。然而，手動生成這些數據并不容易：

為了構造聚類數據，我不得不反復調整 sklearn.datasets.make_blobs 的參數，確保類別之間足夠分離。
想要一個漂亮的螺旋數據集？那就得寫一段復雜的極坐標轉換代碼。
更別提非線性邊界的數據了，稍有不慎，生成的點就會混成一團，毫無區分度。

就在我幾乎要放棄的時候，我發現了 DrawData。它的概念簡單到令人難以置信：直接在 Jupyter Notebook 里用鼠標繪制數據點，然后一鍵導出為 DataFrame。我半信半疑地試了一下，結果——它不僅真的能用，而且生成的數據完全符合我的設想！

DrawData 是什么？為什么它如此強大？

DrawData 的核心功能可以用一句話概括：“所見即所得”的數據生成工具。它提供了一個交互式畫布，讓你可以：

自由繪制數據點：用不同顏色（代表不同類別）直接在圖表上點擊或拖動，生成散點數據。
調整數據分布：你可以控制點的密度、形狀，甚至繪制復雜的模式（如環形、月牙形或自定義曲線）。
一鍵導出：生成的數據可以直接轉換為 Pandas DataFrame，無縫對接 Scikit-learn、PyTorch 等機器學習庫。

它的應用場景非常廣泛：

教學演示：讓學生直觀理解不同數據分布對算法的影響。
快速原型設計：在真實數據尚未準備好時，用合成數據測試模型。
數據增強：為特定任務生成補充數據，比如模擬邊緣案例。

如何使用 DrawData

安裝和使用 drawdata 非常簡單。如果已經安裝了 Python，那么你已經完成了一半。以下是入門方法：

安裝庫：

pip install drawdata

在 Jupyter notebook:中導入并初始化它：

from drawdata import draw_scatter
import matplotlib.pyplot as plt

plt.figure(figsize=(6, 6))
draw_scatter()

圖片

運行代碼時，會彈出一個交互式小部件。然后，你可以單擊并拖動鼠標在畫布上繪制點。每次單擊都會將數據添加到你的自定義數據集，你稍后可以將其導出為 Pandas DataFrame 或 NumPy 數組等格式。

用法：ScatterWidget

你可以加載散點圖小部件以立即開始繪圖。

from drawdata import ScatterWidget

widget = ScatterWidget()
widget

圖片

如果你想使用剛剛繪制的數據集，可以通過以下方式進行：

# Get the drawn data as a list of dictionaries
widget.data

# Get the drawn data as a dataframe
widget.data_as_pandas
widget.data_as_polars

如果你想使用繪制的數據進行 scikit-learn 操作，你可能會喜歡這個屬性：

X, y = widget.data_as_X_y

此屬性的假設是，如果您使用了多種顏色，則表示您對分類感興趣，而如果你只繪制了一種顏色，則表示你對回歸感興趣。在回歸的情況下，y將參考 y 軸。

高級用法

該項目在底層使用anywidget ，因此我們的工具應該可以在 Jupyter、VSCode 和 Colab 中使用。這樣將獲得一個可以與ipywidgets本地交互的適當小部件。

以下是更新繪圖觸發新 scikit-learn 模型進行訓練的示例：

from drawdata import ScatterWidget
widget = ScatterWidget()
import matplotlib.pyplot as plt
from IPython.core.display import HTML
from sklearn.linear_model import LogisticRegression
from sklearn.inspection import DecisionBoundaryDisplay
from sklearn.tree import DecisionTreeClassifier

import matplotlib.pylab as plt 
import numpy as np
import ipywidgets
widget = ScatterWidget()
output = ipywidgets.Output()


@output.capture(clear_output=True)
def on_change(change):
    df = widget.data_as_pandas
    if len(df) and (df['color'].nunique() > 1):
        X = df[['x', 'y']].values
        y = df['color']
        display(HTML("<br><br><br>"))
        fig = plt.figure(figsize=(12, 12));
        classifier = DecisionTreeClassifier().fit(X, y)
        disp = DecisionBoundaryDisplay.from_estimator(
            classifier, X, 
            response_method="predict_proba"if len(np.unique(df['color'])) == 2else"predict",
            xlabel="x", ylabel="y",
            alpha=0.5,
        );
        disp.ax_.scatter(X[:, 0], X[:, 1], c=y, edgecolor="k");
        plt.title(f"{classifier.__class__.__name__}");
        plt.show();

widget.observe(on_change, names=["data"])
on_change(None)
ipywidgets.HBox([widget, output])

圖片

用法：BarWidget

from drawdata import BarWidget

widget = BarWidget(collection_names=["usage", "sunshine"], n_bins=24)
widget

圖片

為什么 DrawData 是數據科學的游戲規則改變者？

1. 教學神器：讓抽象概念“看得見”

作為一名機器學習講師，我深知一個直觀的數據集對教學有多重要。傳統數據集（如 Iris 或 MNIST）雖然經典，但往往不夠靈活——它們無法按需調整來匹配特定算法的講解需求。

DrawData 徹底解決了這個問題。比如在講解 k-means 聚類時，我不再需要說“假設數據分布是這樣的…”，而是直接畫出三個完美分離的簇，讓學生親眼看到算法如何迭代收斂。在演示決策邊界時，我可以隨手繪制一個非線性可分的數據集，讓SVM或神經網絡的分類效果一目了然。

更棒的是，它的互動性極大提升了課堂參與度。當我現場繪制數據集時，學生們的反應往往是：“哇，原來數據可以這樣生成！”這種即時反饋讓枯燥的理論變得生動起來。

2. 快速原型設計：沒有數據？那就畫一個！

在真實項目中，我們常遇到“數據尚未就緒”的困境——也許標注還沒完成，或者第三方數據源延遲了。此時，DrawData 能讓你幾分鐘內生成替代數據集，快速驗證想法。

想測試一個新聚類算法？畫幾個分布復雜的簇試試。
需要調試分類模型？手動繪制線性可分或異或（XOR）模式的數據。
甚至可以用它模擬異常檢測場景，比如故意畫幾個離群點。

這種“即時數據”的能力，讓算法開發不再被數據采集阻塞，尤其適合黑客馬拉松、論文實驗或內部技術預研。

3. 釋放創造力：數據科學也可以“玩”出來

數據科學不僅是數學和代碼，更是一種創造性工作。DrawData 把數據生成變成了數字畫布，讓你像藝術家一樣“雕刻”數據分布：

想做一個螺旋狀聚類？畫出來！
需要月牙形分類邊界？隨手一描！
甚至能模擬現實中的復雜模式，比如地理分布或用戶行為聚類。

這種體驗打破了“數據必須來自現實”的刻板印象，讓我們回歸到問題本質——用最直接的方式表達數據關系。

技術揭秘：DrawData 如何實現“畫布變數據”？

DrawData 的核心技術并不復雜，但設計極其巧妙：

交互式捕獲：基于 Matplotlib 的交互式后端，實時記錄鼠標軌跡和點擊坐標。
動態映射：將屏幕像素坐標轉換為標準化數據范圍（如0-1區間），并支持自定義縮放。
多格式輸出：生成的數據可直接轉為 Pandas DataFrame，或導出為 CSV/JSON，兼容主流工具鏈（如Scikit-learn、PyTorch）。

以下是一個例子：

from drawdata import draw_scatter 
import matplotlib.pyplot as plt 

# 初始化繪圖畫布
plt.figure(figsize=(6, 6))
draw_scatter() 

# 訪問生成的數據
from drawdata.utils import get_data 

x, y = get_data()

利用這些 x 和 y 值，你可以：

將數據保存到 CSV 文件以供日后使用。
將其加載到 Pandas DataFrame 中進行分析。
將其用作 scikit-learn 模型的輸入。

DrawData實戰指南

四大核心應用場景

課堂魔法師

教授SVM決策邊界？隨手畫出非線性可分數據集
演示DBSCAN密度聚類？快速勾勒不同密度的點群
實時調整數據分布，讓"假設性舉例"變成可視化現實

可視化實驗室

測試新開發的D3.js圖表時，即時生成匹配測試用例
驗證matplotlib自定義主題時，快速創建對比數據集
制作演示PPT時，繪制與演講內容完美契合的示意圖

算法外科醫生

當隨機森林出現異常分類時，構建"極端案例"數據集
調試聚類算法時，故意創造重疊率不同的點群
測試模型魯棒性時，繪制包含特定噪聲模式的數據

協作畫布

團隊腦暴時多人接力繪制數據模式
機器學習研討會上實時收集參會者創作的數據集
編程教學中讓學生親手"畫"出第一個數據集

現實約束與應對策略

維度局限 → 解決方案：

通過特征組合模擬高維關系（如繪制X/Y軸代表PCA成分）
結合sklearn.datasets生成高維數據后，用DrawData創建可視化投影

環境依賴 → 平替方案：

在Colab中運行后導出CSV到本地環境
使用pyautogui錄制繪圖動作生成自動化腳本

精度補償 → 增強技巧：

導出后使用scipy.ndimage.gaussian_filter平滑分布
通過sklearn.utils.resample進行數據增強
用numpy.random.normal添加可控噪聲

進階技巧錦囊

動態教學：結合IPython.display實時顯示算法在繪制數據上的演變
混合創作：將DrawData生成的數據與真實數據按比例混合
模式移植：分析繪制數據的統計特征，用GAN生成擴展數據集

DrawData重新定義了數據科學的創作范式——它把"數據準備"這個傳統上最枯燥的環節，變成了最具創造力的過程。就像攝影師需要理解光線一樣，數據科學家通過親手"繪制"數據，能獲得對數據-模型關系更本質的認知。

"工具最大的價值不在于它能做什么，而在于它讓你成為什么樣的思考者。DrawData最革命性的地方，是讓數據生成從被動接受變成了主動創造。" —— 數據科學教育家Sarah Chen

今天就用pip install drawdata開啟你的數據創作之旅。試著完成這個挑戰：繪制一個讓KNN準確率低于50%的魔鬼數據集！

為什么你該試試 DrawData？

DrawData 的出現，讓數據生成從一項繁瑣的編程任務變成了一個充滿創造力的過程。無論你是數據科學家、教育工作者，還是機器學習愛好者，這個庫都能讓你的工作更加高效。

如果你也曾為生成理想數據集而煩惱，不妨試試 DrawData——它可能就是你一直在尋找的“數據畫筆”。

對教師：告別“假設數據”的尷尬，讓抽象算法可視化。
對工程師：快速驗證想法，不再被數據短缺卡住進度。
對愛好者：用最有趣的方式理解數據與模型的關系。

它像數據的“素描本”，讓機器學習從第一天起就變得直觀、互動且充滿創造力。如果你還沒嘗試過，現在正是時候——畢竟，誰能拒絕“畫”出理想數據集的能力呢？

責任編輯：武曉燕來源：數據STUDIO

Jupyter DrawData 數據

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：国产欧美精品在线 | 亚洲性人人天天夜夜摸 | 精品综合 | 亚洲成人中文字幕 | 欧美精选一区二区 | 国产黄色免费网站 | 91人人视频在线观看 | 亚洲狠狠| 91精品综合久久久久久五月天 | 午夜精品久久久 | 国产成人高清成人av片在线看 | 国产电影一区二区在线观看 | 国产精品久久久久无码av | 日韩中文字幕在线视频 | 日日拍夜夜| 在线视频亚洲 | 成年人免费在线视频 | 亚洲精品一二三区 | 妞干网视频 | 91麻豆精品一区二区三区 | 超碰最新在线 | 美女福利视频一区 | 日韩高清国产一区在线 | 国产在线视频一区 | 日本精品视频 | 欧美一区二区三区免费在线观看 | 欧美日韩视频 | 欧美午夜一区 | 在线日韩 | 亚洲国产aⅴ成人精品无吗国产精品永久在线观看 | av黄色在线观看 | 激情一区 | 中文字幕精品一区二区三区精品 | 黑人粗黑大躁护士 | 久久99精品久久久久子伦 | 久久在线看| 国产综合精品 | 日韩一级免费观看 | 国产欧美日韩一区二区三区在线 | 精品国产乱码久久久久久影片 | 中文字幕在线播放第一页 |

<rt id="2y2ka"><acronym id="2y2ka"></acronym></rt><code id="2y2ka"></code><dl id="2y2ka"></dl>

<center id="2y2ka"><acronym id="2y2ka"></acronym></center>

<button id="2y2ka"><input id="2y2ka"></input></button>

<rt id="2y2ka"><acronym id="2y2ka"></acronym></rt>