如何在瀏覽器不崩潰的情況下過濾 200 萬行數據？

科技 03-07

作者 | Filip Rakowski

譯者 | 阿拉丁

最近我分配到了一個非常有趣的任務：在前端顯示 1GB 文件和 200 萬行數據，並實現過濾，在這篇文章中，我將分享我是如何完成這個任務的。

背景

我曾經創建了一個簡單的 React 應用程序。這個應用程序從伺服器載入一些數據，並呈現在幾個表格中。在成功演示了 React 應用程序後，客戶授權我訪問生產數據。然後，有趣的事情發生了。當我將應用程序從開發 API 連接到生產環境並重新載入頁面時，看到了類似「顯示此網頁時出現問題」的錯誤。經過調試，我發現生產伺服器的 JSON 文件大小約為 500MB（而不是從開發伺服器的 2 到 5 MB）。

最新的需求是：

JSON 文件最大可達到 1 GB。

後端不會進行分頁——只能接受這個事實。

首先，我嘗試了 react virtualized，一個 React 組件，可以通過虛擬渲染有效地渲染大型列表。

但幾天後又出現了新的需求：

「標準的瀏覽器搜索（Ctrl/Cmd F）功能無法正常工作，必須修復這個問題！」

虛擬列表背後的主要思想是只渲染可見的內容。因此，如果用戶在搜索框中輸入一些東西，那麼瀏覽器只會搜索虛擬列表的可見部分。

下圖演示了瀏覽器是如何搜索虛擬列表的。請注意，滾動後出現的記錄（虛擬列表進行了重新渲染）沒有高亮顯示，儘管包含了要搜索的值「@」。

搜索框

我決定創建一個具有類似默認瀏覽器搜索功能的自定義搜索框，但可以搜索所有的 200 萬條記錄。

對大量數據進行過濾操作會導致「堆內存不足」。截至 2018 年 4 月，我沒有找到任何提供內置搜索 / 過濾功能的 React 虛擬列表實現。

經過幾個小時的谷歌搜索和在 Stack Overflow 網站上提問之後，我想到了 Web Worker，並使用了 Simple Web Worker 庫。這個方法的主要思想是將一個大數組拆分成更小的部分，並使用 Web Worker 非同步處理每個部分。

找到最佳的塊長度是很有必要的。塊的長度越短搜索速度就越慢，但長度越長，在低配置設備上出現「堆內存不足」的可能性就越大。在我的例子中，根據實驗結果，3000 是最佳長度。

華麗制勝

下圖演示了自定義搜索框。在發生滾動後，高亮顯示不會消失，用戶可以通過箭頭按鍵在行和表之間導航。是的，過濾數據確實需要一些時間，但它可以處理比之前更多的信息。為簡單起見，數組只包含了 9000 個項，但可以隨意添加，不過過濾時間也會隨之增加（過濾 200 萬行可能需要 5-7 分鐘）。

這種方法幫助我解決了幾個問題：

過濾大量數據而不會導致瀏覽器崩潰。在我的例子中，文件的最大大小約為 1GB，最多有約 200 萬行數據。

創建一個搜索框，提供與原生瀏覽器搜索類似的 UX，可以搜索所有 200 萬行數據。

你可以在這裡找到應用程序的源代碼：

https://github.com/uptechteam/react-filter-demo

演示：https://uptechteam.github.io/react-filter-demo/

解決方案簡短描述

這個 React 應用程序包含 3 個組件：

App.js——應用程序的主要組件；

SearchBox.js——實現搜索框功能的組件，使用箭頭按鍵導航搜索結果；

TablesViews.js——渲染結果表格的組件，它演示了如何在表格之間實現 SearchBox 導航。

英文原文

https://blog.uptech.team/https-medium-com-oleksii-kryvonosov-how-to-filter-1gb-json-on-the-frontend-and-not-crash-the-browser-ff59ebeb1baa

點個好看少個 bug

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 InfoQ 的精彩文章:

※前端技術選型的遺憾和經驗教訓
※情人節，教你用數據分析花式撩妹

TAG:InfoQ |