- 使用 LightStep [?]PM 进行分布式追踪
- 开始之前
- 可视化追踪数据
- 追踪采样
- 清理
使用 LightStep [?]PM 进行分布式追踪
此任务说明如何配置 Istio 以收集追踪 span 并将其发送到 LightStep [?]PM。[?]PM 让您可以从大规模生产软件中分析 100% 未抽样的事务数据,从而产生有意义的分布式追踪信息和 metrics,用于帮助解释性能行为并加快根本原因分析。更多信息请访问 LightStep 网站。在此任务的最后,Istio 将从代理发送 span 到一个 LightStep [?]PM Satellite pool,使得它们在 web 界面上可用。
开始之前
请确保您拥有一个 LightStep 账号。请联系 LightStep 创建账号。
请确保您具有配置了 TLS 证书的 satellite pool 和已公开的安全 GRPC 端口。关于如何设置 satellites 请查看 LightStep Satellite 配置。
请确保您具有一个 LightStep 访问令牌。
请确保您可以使用
<Host>:<Port>
的地址形式访问 satellite pool,例如lightstep-satellite.lightstep:9292
。指定如下配置参数部署 Istio:
global.proxy.tracer="lightstep"
global.tracer.lightstep.address="<satellite-address>"
global.tracer.lightstep.accessToken="<access-token>"
global.tracer.lightstep.secure=true
global.tracer.lightstep.cacertPath="/etc/lightstep/cacert.pem"
如果通过helm template
进行安装,您可以在运行helm
命令时,使用—set key=value
的格式设置这些参数。例如:
$ helm template \
--set global.proxy.tracer="lightstep" \
--set global.tracer.lightstep.address="<satellite-address>" \
--set global.tracer.lightstep.accessToken="<access-token>" \
--set global.tracer.lightstep.secure=true \
--set global.tracer.lightstep.cacertPath="/etc/lightstep/cacert.pem" \
install/kubernetes/helm/istio \
--name istio --namespace istio-system > $HOME/istio.yaml
$ kubectl create namespace istio-system
$ kubectl apply -f $HOME/istio.yaml
- 将您的 satellite pool 的 CA 证书以 secret 形式保存在 default namespace 中。如果您在不同的 namespace 中部署 Bookinfo 应用,请在该 namespace 中创建这个 secret。
$ CACERT=$(cat Cert_Auth.crt | base64) # Cert_Auth.crt contains the necessary CACert
$ NAMESPACE=default
$ cat <<EOF | kubectl apply -f -
apiVersion: v1
kind: Secret
metadata:
name: lightstep.cacert
namespace: $NAMESPACE
labels:
app: lightstep
type: Opaque
data:
cacert.pem: $CACERT
EOF
- 遵循部署 Bookinfo 示例应用程序说明。
可视化追踪数据
遵循为 Bookinfo 应用创建 ingress gateway 的说明。
为了验证前序步骤是否成功,请确保在 shell 中设置了
GATEWAY_URL
环境变量。发送流量到示例应用程序。
$ curl http://$GATEWAY_URL/productpage
加载 LightStep [?]PM web UI。
浏览该界面。
在页面顶部找到查询栏。查询栏允许你通过 Service、Operation 和 Tag 值交互式的筛选结果。
从 Service 下拉列表中选择
productpage.default
。点击 Run。您将看到一些和下面相似的东西:
Explorer
- 单击延迟直方图下方的示例追踪表中的第一行,以查看与刷新
/productpage
时相对应的详细信息。页面看起来像这样:
Detailed Trace View
屏幕截图显示追踪由一组 span 组成。 每个 span 对应于执行 /productpage
时调用的 Bookinfo 服务。
追踪中的两个 span 代表了每个 RPC。例如,从 productpage
到 reviews
的请求带有的 span 使用 reviews.default.svc.cluster.local:9080/
operation 和 productpage.default: proxy client
进行标记。这个service 代表了客户端请求的 span。屏幕截图显示请求耗时 15.30 毫秒。第二个 span 使用 reviews.default.svc.cluster.local:9080/
operation 和 reviews.default: proxy server
service 进行标记。第二个 span 是第一个的子级,代表了服务端请求的 span。屏幕截图显示请求耗时 14.60 毫秒。
LightStep 集成目前不能捕获 Istio 内部组件(如 Mixer)产生的 span。
追踪采样
Istio 以可配置的追踪采样百分比捕获追踪数据。要了解如何修改追踪采样百分比,请访问使用 Jaeger 追踪采样进行分布式追踪小节。当使用 LightStep [?]PM 时,我们不推荐将追踪采样百分比降低到 100% 以下。要处理高流量网格,请考虑对您的 satellite pool 进行扩容。
清理
如果您没有计划任何后续任务,请从集群中删除 Bookinfo 示例应用程序及任何 LightStep [?]PM secret。
要删除 Bookinfo 应用程序,请参考 Bookinfo 清理说明。
删除为 LightStep [?]PM 生成的 secret。
$ kubectl delete secret lightstep.cacert