@[TOC](【Mining Data】收集数据(使用 Python 挖掘 Twitter 数据))
具体步骤
- 第一步是注册您的应用程序。特别是,您需要将浏览器指向 http://apps.twitter.com,登录 Twitter(如果您尚未登录)并注册新应用程序。您现在可以为您的应用程序选择名称和描述(例如“Mining Demo”或类似内容)。您将收到一个消费者密钥和一个消费者秘密:这些是应始终保密的应用程序设置。在应用程序的配置页面中,您可以要求访问令牌和访问令牌密钥。与消费者密钥类似,这些字符串也必须保密:它们代表您的帐户为应用程序提供对 Twitter 的访问权限。默认权限是只读的,这就是我们在本例中所需要的,但如果您决定更改权限以在应用程序中提供写入功能,则必须协商新的访问令牌。
重要提示:Twitter API 的使用有速率限制,如果您想提供可下载的数据集,也会受到限制,请参阅:
https://dev.twitter.com/overview/terms/agreement-and-policy
https://dev.twitter.com/rest/public/rate-limiting
Twitter 提供了 REST API,您可以使用它们与他们的服务进行交互。还有很多基于 Python 的客户端,我们可以使用它们而无需重新发明轮子。特别是,Tweepy 是最有趣且易于使用的之一,所以让我们安装它:
在Twitter上注册应用程序并获取相应的API密钥和访问令牌,您可以按照以下步骤操作:
1. 创建Twitter应用程序:
- 访问Twitter开发者平台:https://developer.twitter.com/en/apps
- 如果您还没有Twitter开发者账户,您需要创建一个。如果您已经有账户,直接登录即可。
- 点击“Create an app”创建新的应用程序。
- 填写应用程序的详细信息,包括名称、描述、网站等,并设置回调URL(Callback URL)。
- 提交表单并创建应用程序。
2. 获取Consumer Key和Consumer Secret:
- 创建应用程序后,您将被引导到应用程序的“Details”页面。
- 在页面上,您会看到“API Key”(Consumer Key)和“API Secret Key”(Consumer Secret)。
- 点击“Generate”按钮生成这些密钥。
3. 获取Access Token和Access Token Secret:
- 在应用程序的“Details”页面,向下滚动到“Access and manage your tokens”部分。
- 点击“Create my access t