當前位置:
首頁 > 科技 > 如何在瀏覽器不崩潰的情況下過濾 200 萬行數據?

如何在瀏覽器不崩潰的情況下過濾 200 萬行數據?

作者 | Filip Rakowski

譯者 | 阿拉丁

最近我分配到了一個非常有趣的任務:在前端顯示 1GB 文件和 200 萬行數據,並實現過濾,在這篇文章中,我將分享我是如何完成這個任務的。

背 景

我曾經創建了一個簡單的 React 應用程序。這個應用程序從伺服器載入一些數據,並呈現在幾個表格中。在成功演示了 React 應用程序後,客戶授權我訪問生產數據。然後,有趣的事情發生了。當我將應用程序從開發 API 連接到生產環境並重新載入頁面時,看到了類似「顯示此網頁時出現問題」的錯誤。經過調試,我發現生產伺服器的 JSON 文件大小約為 500MB(而不是從開發伺服器的 2 到 5 MB)。

最新的需求是:

JSON 文件最大可達到 1 GB。

後端不會進行分頁——只能接受這個事實。

首先,我嘗試了 react virtualized,一個 React 組件,可以通過虛擬渲染有效地渲染大型列表。

但幾天後又出現了新的需求:

「標準的瀏覽器搜索(Ctrl/Cmd F)功能無法正常工作,必須修復這個問題!」

虛擬列表背後的主要思想是只渲染可見的內容。因此,如果用戶在搜索框中輸入一些東西,那麼瀏覽器只會搜索虛擬列表的可見部分。

下圖演示了瀏覽器是如何搜索虛擬列表的。請注意,滾動後出現的記錄(虛擬列表進行了重新渲染)沒有高亮顯示,儘管包含了要搜索的值「@」。

搜索框

我決定創建一個具有類似默認瀏覽器搜索功能的自定義搜索框,但可以搜索所有的 200 萬條記錄。

對大量數據進行過濾操作會導致「堆內存不足」。截至 2018 年 4 月,我沒有找到任何提供內置搜索 / 過濾功能的 React 虛擬列表實現。

經過幾個小時的谷歌搜索和在 Stack Overflow 網站上提問之後,我想到了 Web Worker,並使用了 Simple Web Worker 庫。這個方法的主要思想是將一個大數組拆分成更小的部分,並使用 Web Worker 非同步處理每個部分。

找到最佳的塊長度是很有必要的。塊的長度越短搜索速度就越慢,但長度越長,在低配置設備上出現「堆內存不足」的可能性就越大。在我的例子中,根據實驗結果,3000 是最佳長度。

華麗制勝

下圖演示了自定義搜索框。在發生滾動後,高亮顯示不會消失,用戶可以通過箭頭按鍵在行和表之間導航。是的,過濾數據確實需要一些時間,但它可以處理比之前更多的信息。為簡單起見,數組只包含了 9000 個項,但可以隨意添加,不過過濾時間也會隨之增加(過濾 200 萬行可能需要 5-7 分鐘)。

這種方法幫助我解決了幾個問題:

過濾大量數據而不會導致瀏覽器崩潰。在我的例子中,文件的最大大小約為 1GB,最多有約 200 萬行數據。

創建一個搜索框,提供與原生瀏覽器搜索類似的 UX,可以搜索所有 200 萬行數據。

你可以在這裡找到應用程序的源代碼:

https://github.com/uptechteam/react-filter-demo

演示:https://uptechteam.github.io/react-filter-demo/

解決方案簡短描述

這個 React 應用程序包含 3 個組件:

App.js——應用程序的主要組件;

SearchBox.js——實現搜索框功能的組件,使用箭頭按鍵導航搜索結果;

TablesViews.js——渲染結果表格的組件,它演示了如何在表格之間實現 SearchBox 導航。

英文原文

https://blog.uptech.team/https-medium-com-oleksii-kryvonosov-how-to-filter-1gb-json-on-the-frontend-and-not-crash-the-browser-ff59ebeb1baa

點個好看少個 bug


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 InfoQ 的精彩文章:

前端技術選型的遺憾和經驗教訓
情人節,教你用數據分析花式撩妹

TAG:InfoQ |