鍍金池/ 問答/ 數據分析&挖掘問答
                                          離觴 回答

                                          clipboard.png
                                          可以通過捉包得出, 登錄url 不是https://passport.csdn.net/acc...
                                          而是這個https://passport.csdn.net/acc...
                                          session.post(url,data=post_data, headers=headers)
                                          中的url 改回 https://passport.csdn.net/acc... 就可以登錄

                                          慢半拍 回答

                                          設置一個map = {}
                                          遍歷fData
                                          合并map[ownerName]信息
                                          最后把map轉成數組就好了

                                          硬扛 回答
                                          重在怎么在控制臺里使用js發送請求,獲取數據?控制臺不能使用jQuery還有其他第三方庫吧?那么請求怎么發送呢

                                          可以用 jQuery ,只要頁面有引入。
                                          否則,你就自己 new XMLHttpRequest 就好了,自己查這個 API 的文檔吧。

                                          風畔 回答

                                          1、要怎麼讓他以 名稱1, 名稱2, 名稱3.... 排列?
                                          在寫sql語句的時候,寫上

                                          order by 字段名稱 asc

                                          2、把這個數據丟到某個全局變數?
                                          全局變量一般以global關鍵字來聲明,具體可以參考這里
                                          https://www.cnblogs.com/Striv...

                                          久舊酒 回答

                                          你要定位的標簽應該是通過js通過異步來生成的,所以沒法定位,等一段時間試試

                                          孤影 回答

                                          為提升性能,應減少 pandas.DataFrame.apply() 的逐行操作,在本例中可改用 numpy.where() 二元操作符,如下

                                          In [1]: import pandas as pd
                                          
                                          In [2]: import numpy as np
                                          
                                          In [3]: df1 = pd.DataFrame({'t': [1,2,3], 'user_id': [10,20,30], 'v': [1.1,2.2,3.3]})
                                          
                                          In [4]: df1
                                          Out[4]: 
                                             t  user_id    v
                                          0  1       10  1.1
                                          1  2       20  2.2
                                          2  3       30  3.3
                                          
                                          In [5]: df2 = pd.DataFrame({'t': [4,1,2], 'user_id': [40,10,20], 'v': [400,100,200]})
                                          
                                          In [6]: df2
                                          Out[6]: 
                                             t  user_id    v
                                          0  4       40  400
                                          1  1       10  100
                                          2  2       20  200
                                          
                                          In [7]: df3 = pd.merge(df1, df2, how='right', on=['t', 'user_id'])
                                          
                                          In [8]: df3
                                          Out[8]: 
                                             t  user_id  v_x  v_y
                                          0  1       10  1.1  100
                                          1  2       20  2.2  200
                                          2  4       40  NaN  400
                                          
                                          In [9]: df3['v'] = np.where(np.isnan(df3.v_x), df3.v_y, df3.v_x)
                                          
                                          In [10]: df3
                                          Out[10]: 
                                             t  user_id  v_x  v_y      v
                                          0  1       10  1.1  100    1.1
                                          1  2       20  2.2  200    2.2
                                          2  4       40  NaN  400  400.0
                                          
                                          In [11]: del df3['v_x']
                                          
                                          In [12]: del df3['v_y']
                                          
                                          In [13]: df3
                                          Out[13]: 
                                             t  user_id      v
                                          0  1       10    1.1
                                          1  2       20    2.2
                                          2  4       40  400.0
                                          敢試 回答

                                          爬取頁面信息,對獲取的數據進行過濾,篩選,排序等操作,通過一定的算法,把整理后的數據展示給用戶。
                                          至于具體怎么個智能解析,外人哪里知道。

                                          兔囡囡 回答

                                          下載的SDK文件中的config配置參數沒有改,改成自己的微信參數就OK了

                                          菊外人 回答

                                          You can match other attributes like id or class, src.

                                          愿如初 回答

                                          一篇不錯的反爬蟲技術方案博文:https://github.com/FantasticL...

                                          孤星 回答

                                          假設你的這段html代碼命名為s

                                          from bs4 import BeautifulSoup
                                          
                                          soup = BeautifulSoup(s, "lxml")  
                                          table = soup.find("table", {"class", "mod_table"})  # 獲得table,用class來限制唯一性
                                          trs = table.find_all("tr")[1:-1]  # 獲得table內的各行,去除表頭(第一行)和頁碼(最后一行)
                                          result = [tr.find_all("td")[4] for tr in trs]  # 獲得每個tr里的所有td中的第5個(目標)

                                          獲取html上的元素一般都可以用這種方法。

                                          伴謊 回答
                                          pd.concat(frames, axis=1, join_axes=[A.index])

                                          而不是 'A'.index, 加單引號表示其為字符串了。

                                          茍活 回答

                                          可能是抓錯了?微博抓包的話建議用瀏覽器打開移動端的鏈接,直接用m.weibo.com登錄就行了,那個接口很好用。

                                          首頁 上一頁 1 2 3 4 5 6 7 8 下一頁 尾頁
                                          人妻精品动漫h无码中字